图源:使用Dreamina生成 文生视频大模型Sora已经发布一个多月,其所带来的震撼依然在业内延续。这是继ChatGPT后,OpenAI再次向行业投入一枚深水炸弹。 据介绍,Sora可以根据简单提示生成最长一分钟,多种风格、不同画幅、多视角的高清图片。在广为流传的一则Sora生成的视频中,一个穿着时尚的女子走在东京街头,背景中繁华街景、女人墨镜反射的细节、皮肤的瑕疵都清晰可见,该视频包含中景、近景、远景等多个镜头,展示的效果相比其他的文生视频模型如Runway、Pika等有了显著提升。 图源:OpenAI官网截图 “ Sora这类视频生成模型是世界的模拟器 。”OpenAI在报告中说道,这种模拟能力使 Sora 能够生成更加接近真实世界运行的视频内容。 这枚炸弹的威力仍在缓慢释放,百模大战仍在继续。数月前,艾伦人工智能研究所发布新一代大模型,Unified-IO 2。数日前,被称为“OpenAI 最强竞争对手之一”的Anthropic发布了最新人工智能Claude 3系列模型(包括了 Opus、Sonnet、Haiku 三款产品),其中功能最强大的Opus智能程度堪比人类。此外,业界也在翘首期盼GPT-5的到来。 这场无法忽视的技术革命,给技术领域和视频领域带来的冲击也是无法忽视的,尤其是以抖音为代表的短视频领域, Sora一旦投入使用必将对眼下短视频的内容和商业模式产生一定的影响。 面对技术浪潮,抖音也没有被动“躺平”。 抖音正尝试突破惯性的力量,10年元老员工张楠辞去抖音集团CEO一职,全力聚焦剪映,这也让原本一直“默默无闻”的剪映逐渐走进大众视线;此外,字节跳动加大对AI的投入力度,成立新AI部门Flow,抽调多个业务部门人才加入,接连推出一系列AI产品。 字节跳动的危机感、国际视野和创新意识在Sora到来之际,全面显现。 主笔/ 李言恺 文章架构师/ 枫叶 出品/ 飞娱财经 抖音的焦虑 尽管Sora并不完美,但没有人能否认它的出现是AI领域的一次新的革命。首先,它生成视频时长最长可达60秒,远超市面上主流的如Runway、Pika、SVD等AI视频生成工具。 随着Sora的出现,短视频平台抖音和TikTok不得不面对一个前所未有的挑战。这个异星文明的登陆,无疑引发了公司层面的焦虑。字节跳动CEO梁汝波在2024年年度全员会上表达了对新技术的担忧,这并非没有根据。一方面,抖音和TikTok的内容生态高度依赖于短视频,而1分钟以内的视频占据了大多数内容池。另一方面,Sora的出现将打破传统的剪辑产品,降低视频创作门槛,并可能改变内容和剪辑的界限。 更为重要的是,Sora对传统剪辑产品的降维打击。它降低了视频的创作门槛,用户可以通过简单的语言交互界面和对话结果产生方式生成充满细节的视频。开源后,Sora的用户贡献素材能够丰富数据资源,提升其表现。这意味着未来内容和剪辑可能合二为一,AI将重塑内容产品形态与功能,单一性工具产品的市场空间会受到影响。 事实上,抖音已经在AI领域“再次创业”。梁汝波在全员会上多次提到危机感,他特别提到公司丧失对机会的敏感度。张楠与剪映率先冲锋。实际上,让剪映再次受到关注的是今年年初一则消息,张楠辞去抖音CEO,把精力聚焦在剪映的发展上,亲自带队寻求在AI辅助创作上有所突破。 剪映于2019年上线,2021年剪映专业版Windows正式上线,自此剪映实现全终端覆盖。公开信息显示,上线三年里剪映相关产品高速发展,截至2021年,剪映的月活用户已经突破1亿,是国内最大的移动视频编辑产品。剪映最开始被视为一个依附于抖音的工具App。 随着抖音的迅速崛起,字节跳动的张楠作为公司的核心人物之一,在推动短视频平台的发展方面发挥了重要作用。她不仅推动了抖音成为国民级应用,还明确表达了将AI技术视为公司未来的重要发展方向。 张楠在内部信中强调了AI对内容创作工具行业的影响,并表示AI图像生成技术给她带来了深刻的触动。她认为这项技术将为创作者提供前所未有的便利,使内容创作更加高效和多样化。此外,张楠还分享了她在2024年加入公司的十周年愿望,希望能够继续追随这个AI时代,探索更多热爱的事业。 剪映作为抖音突围Sora的最佳产品抓手,已经在市场上取得了显著的成功。它不仅拥有庞大的用户基础,还在过去一年中推出了多项AI功能,如一键成片、AI克隆音色和数字人口播等,极大地提高了创作者的制作效率和降低成本。这些功能的推出不仅展示了剪映在AI领域的深厚积累,也体现了抖音对于创新和技术驱动发展的坚定承诺。 随着国内短视频行业的触达天花板,以及AI技术的不断进步,抖音选择加强在AI领域的布局显得尤为重要。通过深耕AI技术,抖音不仅能够巩固其在视频创作与在线视频广告领域的优势,还能够为公司开辟新的增长点。这一战略决策不仅符合抖音的长期发展目标,也为整个行业带来了积极的示范效应。 去年,AI图片创作和绘画工具“Dreamina”开始内测,它根据用户文字提示生成四幅由AI创造的图片,展现出不同的风格。此外,Dreamina AI 视频功能也有望后续上线,这标志着AI在视频创作领域的发展。 就在张楠上任剪映一周后,OpenAI正式推出Sora。尽管Sora有着无可匹敌的技术条件,但Sora无法取代抖音和剪映。一方面,Sora存在明显的缺陷,例如在理解物理运动规律上仍有不足。另一方面,抖音已经构建了庞大的创作者生态和内容生态,背后基于生活的经验与叙事,很难被轻易取代。 好莱坞影视创作者认为,Sora影响的将是视觉特效和动画行业,它目前更像一个科技公司的产品演示,而不是一个可以叙事的作品。更从底层的逻辑而言,剪映与Sora并不是一类产品,使用场景不同。前者基于图片和视频编辑,用户使用需要一定的时间和精力成本;后者大大降低不同内容形式间转化的门槛,不少专业人士认为Sora的应用层面超越工具,将很快走入更专业的影视创作、视觉特效等创作行业。 对于Sora是否会取代剪映的问题,DCCI互联网研究院院长刘兴亮在参与《Sora出圈,普通人如何挖到“第一桶金”?》的讨论时也给出了否定答案。他指出,剪映和Sora是两个不同的工具,在视频制作过程中有各自的应用场景。虽然可以使用Sora生成视频素材,并结合其他工具进行整合编辑,但这并不能替代专业操作所需的剪映软件。 尽管Sora并不能取代剪映,但是剪映也必须作出改变。如果剪映不能跟随技术的趋势作出改变,必将被其他竞品所取代。剪映也看到了这一危机,未来可能成为一款集成式的AIGC创作工具,降低不同形式内容的创作及转化门槛,或将成为下一款超级APP。 梁汝波曾在发言中多次提及“危机感”,并将“加强危机感”列入年度目标。他表示,最大的危机感,是担心字节作为一个组织,正在变得平庸,无法取得新的突破。 在互联网的浪潮中,字节跳动以其独特的创新精神,成功打破了传统互联网公司的内容生产惯性。2023年,随着百度和阿里相继推出文心一言和通义千问,标志着BAT三大巨头均已加入生成式AI的大潮,而字节跳动却似乎落后了一步。 2023年3月,百度率先发布文心一言,同年10月便迭代至4.0版,全面提升理解、生成、逻辑和记忆四大人工智能基础能力,年底用户规模突破1亿。阿里的通义千问于同年4月面世,而相对保守的字节跳动和腾讯,都直到2023年下半年才分别发布云雀大模型和混元助手。 面对竞争的压力,字节跳动CEO梁汝波提出了“始终创业,逃逸平庸的重力”的解题思路。为了应对这一挑战,字节跳动加大了对AI技术的研发投入。据悉,去年年底字节跳动成立了一个专注于 AI 创新业务的新部门 Flow,并且抽调了内部高层管理与业务骨干担任该部门的相应负责人。Flow部门目前已经上线了豆包、Coze/扣子、AI角色互动APP“话炉”等AI产品,此外,由Flow部门打造的AI产品“PicPic”,也于日前在海外正式上线。 字节跳动在移动互联网领域以惊人的速度崛起成为行业里的后起之秀,在短短几年的时间里,成为了让阿里与腾讯都无法忽视的存在。新时代下,字节跳动采用了同样的打法,能否再打造出一个像抖音一样的“爆款”,我们拭目以待。