Kainy的订阅号

【标题】国内视频生成模型的现状与Sora的差距

【核心内容】

谷歌发布多模态大模型Gemini 1.5 Pro的同一天，OpenAI发布新一代文生视频模型Sora，引起全球关注。
Sora以一种所见即所得的方式将震撼输入到我们的眼睛，实现了从文本到视频的输入输出。
Sora作为一个“世界模拟器”，展现了模型对物理世界的理解，具有很高的逼真度和连贯性。
国内大厂如字节、腾讯、百度、阿里以及创业企业都有自己的视频生成模型，但与Sora相比仍有差距。
腾讯的VideoCrafter2支持个性化视频生成和更深度的控制生成结果，百度的UniVG具有统一模型和高清逼真的特点，阿里的I2VGen-XL在图像生成视频方面表现出色。
创业公司如HiDream和PixVerse也有视频生成应用，但仍然与Sora相比有较大差距。

【评论内容】小红书用户：这些国内视频生成模型都很努力，但与Sora相比，还是差距很大啊，看来要超越Sora还有很长的路要走。

微信公众号读者：国内的视频生成模型都是在追赶Sora，但是始终还是落后一步，真正的创新需要从智能的边界出发，而不是仅仅局限在一个领域。

" 【标题】Sora 引领文生视频模型革新，国内厂商跟进情况一览

【核心内容】

Sora 作为 OpenAI 的新一代文生视频模型，其颠覆性技术引起了全球关注。
Sora 具有从文本到视频的直接转换能力，且视频时长可达 60 秒，具有高度的连贯性和逼真度。
Sora 的技术优势在于其作为“世界模拟器”的潜力，对物理世界的理解程度远超其他模型。
国内厂商如字节、腾讯、百度、阿里等也纷纷推出了自己的文生视频模型，如 MagicVideo-V2、VideoCrafter2、UniVG 等，但与 Sora 相比仍有明显差距。

【评论内容】小红书用户：Sora 真是太牛了，感觉国产模型跟它比还有很长的路要走啊！微信公众号读者：国内厂商在文生视频模型领域的创新确实还有很大的提升空间，期待看到更多具有突破性的技术出现！"