2026年1月底至2月初,国内互联网大厂密集发布了新一代多模态大模型,视频生成技术正经历从“随机生成”向“工业级可控”的关键转变。快手、字节、阿里等公司接连更新其视频与图像基座模型,旨在解决AI视频在商业应用中“废片率”过高的痛点。这种技术进步直接带动了传媒板块的二级市场表现,截至2026年2月11日,传媒行业在过去12个月内的绝对表现达到42.7%,相对沪深300指数录得21.6%的超额收益。
本次梳理主要聚焦快手、字节、阿里等大厂在多模态领域的最新进展,详细拆解了可灵3.0、Seedance 2.0以及Qwen-Image-2.0的技术指标与商业化路径,并统计了传媒行业在算力、IP版权及应用工具等细分方向的投资机会。
一、物理模拟与叙事进阶
快手于2026年1月31日发布的可灵3.0系列,标志着视频生成模型进入了高精度与强叙事的新阶段。该系列涵盖了图片3.0、视频3.0以及全新的Omni模式,重点在模型精度、主体一致性和复杂指令理解上进行了系统性优化。最核心的变化在于可灵3.0实现了文本与视觉角色的精准映射,尤其是在多人同框场景下,能够有效解决过去常出现的指代混乱难题。
在具体功能上,视频3.0支持中、英、日、韩、西等多语种以及地道方言的演绎,能够实现口型与神态的自然流畅配合。这种能力的提升使得AI视频不再仅仅是单镜头的堆砌,而是具备了“读懂剧本”的能力,可以根据包含场景描述、动作顺序和情绪氛围的复杂指令生成连贯内容。此外,视频3.0的主体参考功能可以将人物或物体的跨镜头一致性显著增强,确保在连续动作或多镜头切换中,角色外观保持稳定,这为影视短剧的专业化制作奠定了基础。
图片生成方面,快手的图片3.0支持最多10张参考图,能够精准锁定各图的主体轮廓和色调基调,从而在底层强化多图创作的风格统一。这种一致性强化升级,配合人像真实感的提升,使得皮肤肌理等细节刻画更加细腻,画面整体更具电影级的视觉质感。
二、工业级控制标准确立
紧随其后,字节在2026年2月7日正式发布了视频生成模型Seedance 2.0。与快手侧重“专业叙事”不同,字节的逻辑更偏向“效率基建”,其核心目标是通过精准控制大幅降低用户的“抽卡”成本。Seedance 2.0定义了一种全新的多模态交互范式,用户可以通过“@素材名”的方式,指定图片、视频或音频的具体用途。
这种交互方式允许模型精准提取特定素材的信息,例如@视频可以指定运镜方式,@图片可以锁定细节特征,@音频则可以控制视频节奏。这种强干预能力将视频生成从“黑盒模式”转化为了工业化的可控工具。在技术参数上,Seedance 2.0支持最多9张图片输入,视频和音频输入各限3个且总时长不超过15秒,单次生成的视频时长可由用户在4至15秒间自由选择。
字节的这种策略旨在降低内容生产门槛,利用其超级APP的生态逻辑,反哺短视频平台的繁荣。对于短视频营销、电商素材生产等对ROI(投资回报率)敏感的领域,Seedance 2.0的这种低成本、高成功率特性具有极强的规模化应用潜力。
三、图像基模与电商护城河
在视频模型激战正酣时,阿里与字节也同步更新了图像生成基模。2026年2月10日,阿里发布了新一代图像生成及编辑模型Qwen-Image-2.0,该模型集成了生图与编辑功能,在AI Arena文生图评测中位列全球第三。阿里的优势在于垂直场景,特别是电商领域,通过高保真图像模型的更新,进一步强化其在商品数字化方面的竞争力。
同一天,字节也发布了图像模型Seedream 5.0,并明确对标谷歌的Nano Banana Pro,强调在保持高性能的同时具备更低的使用成本。截至2026年2月11日的全球多模态模型排名显示,虽然谷歌和OpenAI仍占据前列,但随着国内厂商在物理模拟真实度和图生视频一致性上的巨大提升,国产模型在榜单中的排名有望持续上升。
四、生产成本结构重塑
这一轮模型升级的本质是AI视频生成从盲盒式娱乐向精准工业化生产的跨越。过去,AI视频无法大规模商用的核心痛点在于“抽卡”导致的边际成本不可控,而新一代模型通过原生多模态架构和指令对齐,显著降低了“废片率”。这意味着内容生产的边际成本开始趋向于算力成本。
在短期应用上,这种技术进步将直接改善营销和电商服务商的毛利,提升素材产出效率;同时,漫剧、短剧行业将迎来产能的爆发式增长。从中长期来看,随着内容产出的低门槛化,IP的稀缺性将进一步放大。头部IP及其衍生品的价值将持续走高,而腰部IP也有望通过AI视频化实现价值的重估。拥有强算力基础设施和闭环流量场景的巨头公司,将成为这一轮技术红利的主要捕获者。
五、传媒板块机会梳理
多模态模型在推理侧的频繁调用,形成了对云服务与算力的直接拉动。从投资角度看,下游的内容IP方、版权方以及AI应用工具提供商将是最先受益的群体。目前传媒行业总市值约为2.26万亿元,流通市值2.08万亿元,涵盖138家上市公司。该板块近期表现强劲,1个月内绝对表现为8.9%,6个月内达到31.9%,展现出较强的反弹潜力。
针对具体的方向,市场建议关注四大核心板块:内容IP、内容版权、制作工具及云服务。其中,内容IP被视为漫剧、短视频的灵魂,是内容涌现的关键价值所在;内容版权则构成了AI时代的合规护城河;AI制作工具随着模型能力的提升,有望演进为全栈服务工作站;而互联网平台提供的AI云服务则是推理侧不可或缺的“水与电”。
六、受益公司分类汇总
1. 内容IP:中文在线、阅文集团、上海电影、掌阅科技、欢瑞世纪。
2. 内容版权:阜博集团、捷成股份、华策影视、视觉中国。
3. AI视频制作工具/模型:中文在线、掌阅科技、万兴科技、美图、快手、Minimax。
4. 互联网平台/AI云服务:阿里巴巴、腾讯、百度、金山云。
本站是社保查询公益性网站链接,数据来自各地人力资源和社会保障局,具体内容以官网为准。
定期更新查询链接数据 苏ICP备17010502号-11