OpenAI于2024年2月推出的初代Sora模型,堪称视频领域的GPT‑1时刻,2025年9月底,OpenAI推出Sora2,视频领域迎来GPT3.5式突破时刻。10月16日,谷歌在Gemini API中发布了Veo3.1和Veo3.1Fast付费预览版,在Veo3基础上进行了重大升级,带来更丰富的音频支持、更强的叙事控制及更逼线系列模型和字节Seedance2.0相继正式上线年多模态模型有望迎来DS时刻,在能力提升的同时,实现成本端大幅下降,从而推动影视、游戏、广告等内容创意领域的繁荣。
(2)可灵3.0系列和字节Seedance2.0相继上线,开启多模态领域的竞争2月5日,可灵AI正式全球上线系列模型,可灵系列基于All-in-One产3.0
品和技术理念构建,形成一个多模态输入与输出高度统一的一体化视频模型体系。此次发布的可灵视频3.0、可灵视频3.0Omni及可灵图片3.0、可灵图片3.0Omni模型,覆盖图片生成、视频生成、编辑及后期等影视级全流程链路,标志着AI正式进入影视与创意内容的核心生产环节。2月7日,Seedance2.0正式上线,其特征为:能生成线p分辨率视频,提供符合专业标准的广播级输出;音视频同步,生成视频内容的同时生成同步的音频;多镜头叙事能力;Seedance V2运动合成”的技术,可产生流畅、逼真的运动;卓越的提示词遵循能力,能够准确解释和执行复杂的指令。可灵3.0系列和字节Seedance2.0相继上线,多模态领域迎来突破性进展。
(3)可灵3.0系列和字节Seedance2.0相继上线,开启多模态领域的竞争随着多模态模型能力的提升,模型商业化潜力也将进一步释放。可灵AI是国内商业化最快的多模态模型之一,截至2025年12月,可灵AI已拥有超6000万创作者,生成视频超6亿个,服务企业用户超3万,年化收入运行率达2.4亿美元。我们认为2026年将是多模态厂商降本提质,实现商业化的关键一年。
我们认为2026年多模态模型有望迎来DS时刻,推动影视、游戏、广告等内容创意领域的繁荣。受益标的包括万兴科技、海天瑞声、虹软科技、当虹科技、快手-W、美图公司等。此外,继续关注AI应用端投资机会,推荐金山办公、合合信息、鼎捷数智、迈富时、致远互联、金蝶国际、博彦科技、用友网络、同花顺、恒生电子、拓尔思、科大讯飞、焦点科技、中科创达、税友股份、上海钢联等,受益标的包括泛微网络、福昕软件、汉得信息、万兴科技、第四范式、多点数智、北森控股、新开普、新致软件、欧玛软件、汉邦高科、石基信息、汉王科技、汉仪股份、三六零、彩讯股份、金桥信息、佳讯飞鸿等。
