那个从米哈游"退休"的蔡浩宇,又搞了个大新闻。
上周,他创立的AI公司Anuttacon发布了LPM 1.0——一个让虚拟角色会"表演"的视频大模型。演示里,AI生成的角色会呼吸、会停顿、会根据你说的话点头皱眉,甚至能连续45分钟保持身份一致。
有媒体直呼"最像人的一次"。
这期节目,我们聊聊:
蔡浩宇为什么要从米哈游"退休"去搞AI?
LPM 1.0凭什么号称突破了"表演三难困境"?
"全双工对话"是什么体验?
不开源的模型,商业逻辑在哪里?
这对游戏行业意味着什么?
LPM 1.0
Large Performance Model,大型表演模型。蔡浩宇旗下Anuttacon发布的视频角色表演生成模型,170亿参数,支持全双工对话和无限时长生成。
表演三难困境
高表现力、实时推理、长时稳定——这三件事在视频生成中很难同时实现。LPM 1.0声称全部解决。
全双工对话
双方可以同时说话、互相打断的对话模式,需要同时处理两路音频流。
自回归漂移
视频生成时间拉长后,微小误差累积导致角色脸部骤变、身份不一致的现象。
——
Anuttacon:蔡浩宇在新加坡创立的AGI公司,专注AI交互式内容和游戏
《群星低语》(Whispers From The Star):AI驱动的互动叙事游戏
AnuNeko:AI聊天产品,猫咪角色有性格和偏好
鹿鸣:米哈游虚拟形象
林离:与米哈游关系紧密的虚拟角色
——