Newsroom
AIEII

AI 周刊 #16:地缘冲突下的 AI 资产、Qwen 3.5 重新定义 Agent、HeyGen 让视频说任何语言

海湾局势升温推动 AI 成避险资产,Qwen 3.5 发布主打自主 Agent 能力,HeyGen 视频翻译保留唇形同步,Samsung 计划年底 8 亿 AI 设备,本地 AI 框架 LocalFirst 开源。

2026年03月23日

这周的新闻被两股力量拉扯:一边是地缘冲突带来的不确定性,一边是 AI 技术继续按自己的节奏往前推。

有意思的是,这两股力量居然在一个点上交汇了。


头条:地缘冲突升温,AI 相关资产逆势上涨

海湾局势本周持续升级。全球股市下滑,收益率攀升,风险偏好全线下降。美元指数涨到 100.05,避险情绪浓厚。

但在一片绿色中(跌的意思),有一类资产表现异常坚挺:AI 相关标的

NVIDIA、Microsoft、Google 母公司 Alphabet 等 AI 核心股票的跌幅明显小于大盘。部分分析师给出的解释是:AI 被视为"确定性增长",在不确定性加剧时反而成了避风港。

逻辑是这样的:

  1. 地缘冲突增加了全球供应链的不确定性
  2. AI 自动化可以减少对人力和物理供应链的依赖
  3. 企业加速 AI 部署不是"可选项",而是"必选项"
  4. 因此 AI 基础设施的需求不会因为冲突而减少,反而可能加速

Morgan Stanley 上周刚发了那份"2026 年 AI 突破大多数人没准备好"的报告,这周就被地缘冲突验证了一半:当其他行业在避险的时候,AI 行业还在投资和扩张。

当然,这种"AI 避险论"有多大的持续性,还需要观察。但至少在短期内,AI 行业展现出了和传统行业不一样的韧性。


Qwen 3.5:重新定义什么叫"Agent 能力"

阿里云发布 Qwen 3.5,这次不是简单的参数升级,而是在 Agent 能力上做了实质性突破。

核心变化:从"回答问题"到"自主执行任务"。

Qwen 3.5 的设计目标是让 AI 能够:

  1. 自主规划多步骤任务:你说"帮我准备下周的项目汇报",它会自己拆解成:收集数据 → 分析趋势 → 生成图表 → 撰写 PPT 大纲
  2. 多模态输入:不只是文字。图片、视频都可以作为输入,而且能分析长达 2 小时 的视频内容
  3. 工具调用:原生支持调用外部 API、数据库、文件系统

2 小时视频分析这个能力值得多说几句。之前的多模态模型处理视频基本限制在几分钟以内。Qwen 3.5 能处理 2 小时意味着它可以:

  • 看完一场完整的会议录像并生成纪要
  • 分析一整集综艺节目或纪录片
  • 审查一段完整的监控录像

价格方面,Qwen 3.5 延续了中国模型"性价比"的传统。加上之前 MiniMax M2.5 在基准测试上接近 Claude Opus 4.6 的表现,中国 AI 模型正在用"一半的价格提供八成的能力"这个策略快速占领市场。

Qwen 3.5 的 Agent 能力如果在实际使用中能兑现宣传的效果,那它可能是目前性价比最高的 Agent 开发基座模型。但"宣传"和"实际"之间的差距,在 AI 行业里向来不小,建议等第三方评测再做决定。


HeyGen:让你的视频说任何语言

在 AI 工具领域,本周最让我印象深刻的是 HeyGen 的视频翻译功能。

简单说:你给它一段视频,它可以把说话者的语言翻译成另一种语言,同时保持:

  • 原始声音的音色和语调
  • 唇形同步(嘴型和新语言对得上)
  • 面部表情

这不是简单的配音或字幕。这是让视频里的人"真的在说另一种语言"。

我测试了一段中文技术演讲翻译成英文的效果。除了偶尔的语调不够自然外,如果不告诉你这是 AI 翻译的,你很可能看不出来。

应用场景很明确

  • 跨国企业的内部培训视频,一次录制多语言分发
  • YouTube / B站创作者一键做多语言版本
  • 电商产品视频的全球化
  • 在线教育内容的本地化

定价:免费版每月可以翻译有限时长,付费版 $29/月起。考虑到专业人工配音+唇形合成的成本(通常几千美元一分钟),这个价格是颠覆性的。

语言障碍是信息传播最大的摩擦力之一。HeyGen 这类工具正在把这个摩擦力降到接近零。对中国创作者来说,这意味着你的内容天然就可以是全球化的。


Samsung:年底 8 亿台 AI 设备

Samsung 本周确认了一个激进的目标:到 2026 年底,搭载 Gemini AI 的三星设备将达到 8 亿台

这个数字意味着什么?

全球智能手机用户大约 45 亿。如果 Samsung 完成目标,相当于每 5-6 个智能手机用户中就有一个在使用内置 Gemini AI 的三星设备。

Samsung 的策略是把 AI 从旗舰机下沉到中端甚至入门机型。通过优化后的 Gemini 模型,即使是千元级手机也能运行基础的 AI 功能:

  • 实时翻译(打电话时自动翻译对方说的话)
  • 图片编辑(选中对象一键移除/替换)
  • 摘要生成(长文一键总结)
  • 搜索增强(圈选屏幕内容直接搜索)

Apple 的应对策略也在本周明确:和 Google 合作,用 1.2 万亿参数的 Gemini 模型,通过 Apple Private Cloud Compute 提供服务。Apple 的重点在隐私保障,确保用户数据不被 Google 直接获取。

AI 作为手机卖点,正在从"旗舰专属"变成"人人标配"。这对 AI 行业意味着更大的用户基数,对消费者意味着更便宜的 AI 使用门槛。


开源亮点:LocalFirst AI 框架

斯坦福大学开源了 LocalFirst AI 框架,核心理念只有一个:你的 AI 助手的所有数据处理都在本地完成,永远不上云。

技术架构:

  • 量化后的 7B-13B 参数模型本地运行
  • WebAssembly 实现跨平台(浏览器、桌面、移动端都能跑)
  • 个人数据存储在本地加密数据库
  • 离线可用,连网时可选择性同步

能力上当然还比不了 GPT-5.4 或 Claude Opus 这样的前沿云端模型。但对于日程管理、邮件分类、文档摘要这些场景,本地模型已经够用了。

这个框架最大的价值在于:它给了"隐私优先"用户一个真正可用的选择。


快讯速览

  • Midjourney V7 画质再升级,对中文提示词的理解能力显著提升
  • Adobe Firefly 推出视频生成功能测试版,直接集成在 Premiere Pro 中
  • Notion AI 新增"自动化工作流"功能,可以根据数据库变化自动触发 AI 处理
  • 印度总理 公开表态"封锁霍尔木兹海峡不可接受",地缘局势对全球科技供应链的影响值得持续关注

本周观点

这周让我想了很多的不是某一条技术新闻,而是一个交叉现象:地缘冲突和 AI 发展的叠加效应。

传统上,战争和冲突会拖慢技术进步。但 AI 似乎是个例外。冲突加速了企业对自动化的需求,不确定性推动了对"确定性技术"的投资,供应链风险让"本地 AI"和"边端 AI"变得更有吸引力。

这不是说战争是好事。但它确实在以一种奇怪的方式,加速了 AI 从"锦上添花"到"基础设施"的转变。

当一个技术从"nice to have"变成"must have"的时候,它的发展就不再受经济周期的影响了。AI 正在走这条路。

下周见。


本文首发于 aieii.com,一个关注 AI 工具与趋势的中文内容平台。

广告合作联系
立即联系 →
加入会员申请
了解详情 →
← AI 周刊 #15:GPT-5.4 正式发布、Gemini … Notion AI vs Claude:AI 文档助手到底该 … →
💬 Comments
6 min read