据《华尔街日报》报道,Meta 正在推进一系列新一代人工智能模型的研发,覆盖图像、视频以及文本等多个方向。
多位知情人士透露,Meta 内部目前正在开发一款代号为Mango 的全新图像与视频生成模型,同时也在打磨下一代以文本为核心的大型语言模型,相关成果预计将在2026 年上半年对外发布。
战略升级
在最近一次公司内部的问答交流中,Meta 首席人工智能官 Alexandr Wang 与首席产品官 Chris Cox 向员工介绍了这些模型的整体规划。
Wang 提到,新一代文本模型代号为 Avocado,其核心目标之一是显著提升编程与代码生成能力,以更好服务开发者和企业级用户。
Avocado 的开发方向可能标志着 Meta 在 AI 开源策略上的调整。过去 Meta 一度大力推广开源模型(例如 LLaMA 系列),但有报道指出,“Avocado” 很可能采用闭源或收费访问的模式,这是对公司过去策略的一次重要修正。
与此同时,Meta 也已开始探索更前沿的研究方向——“世界模型”。这类 AI 通过持续吸收视觉信息来理解和建模周围环境,被认为是通向更高阶通用智能的重要一步。
Wang 表示,该方向目前仍处于早期研究阶段,但已被视为公司长期 AI 战略的一部分。
今年夏天,Meta 对其 AI 组织架构进行了大幅调整,成立了新的Meta Superintelligence Labs(超级智能实验室),并由 Wang 负责领导。
Meta 首席执行官 Mark Zuckerberg 亲自参与核心人才招募,从多家头部 AI 机构吸引了二十多名研究人员,并组建了一支超过 50 人的跨学科研发团队,涵盖模型研究、工程实现及产品化等多个环节。
Meta 的 AI 布局
在过去一两年间,AI 技术尤其是生成式模型领域的竞争愈发白热化。图像与视频生成技术已成为大型 AI 公司争夺用户注意力和产品差异化的重要战场之一。
2025 年 9 月,Meta 与初创公司 Midjourney 合作推出了 AI 视频生成工具 Vibes;几乎在同一周,OpenAI 也发布了自己的视频生成应用 Sora,显示出各大厂商在这一细分领域的快速布局。
竞争不仅限于产品功能,还体现在用户增长层面。谷歌推出的图像生成工具 Nano Banana 成功推动其 Gemini AI 的月活跃用户数从约 4.5 亿增长至超过 6.5 亿,凸显了视觉 AI 的用户吸引力与商业潜力。
OpenAI 在发布 Gemini 第三版模型后,首席执行官 Sam Altman 曾公开强调图像生成是消费者最关注的 AI 功能之一,是提高用户黏性的重要因素。
在多方竞逐之下,图像、视频与文本能力的融合,正逐渐成为衡量下一代 AI 模型实力的关键指标。Meta 此次在多模态模型与基础研究上的同步投入,也被外界视为其试图在新一轮 AI 竞争中重新确立技术优势的重要一步。其策略关键在于:
快速迭代产品能力——通过 Mango、Avocado 提供更强的生成与理解能力;
战略人才与组织建设——吸引行业顶尖人才,建立面对未来的研发架构;
平衡开源与商业化路径——在开放创新与商业模式之间寻找最佳策略点;
深化应用场景融合——将 AI 能力嵌入社交、创作、开发者工具等核心业务。
参考资料:
https://www.wsj.com/tech/ai/meta-developing-new-ai-image-and-video-model-code-named-mango-16e785c7?mod=hp_lead_pos2
//www.jiqiren.org.cn/upload/2025/meta-is-reportedly-set-to-release-new-ai-models-for
【免责声明】本站所刊内容仅代表作者本人观点,与机器人网站无关。机器人网站对文中陈述、观点判断保持中立。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权,请联系我们删除。
本文地址:http://www.jiqiren.org.cn/news/1327.html
