AI行业周报:Gemini 3.5 Flash即将发布、Nvidia H200出口受阻、GPT-5.6开发中

2026年5月中旬,AI行业又迎来一波密集动态。Google I/O在即、中美芯片博弈升级、OpenAI继续月更节奏——这几件事值得认真关注。

Google I/O最大悬念:Gemini 3.5 Flash要来了

原本大家预期Google会在5月19日的I/O上发布Gemini 3.2 Flash,但最新消息显示Google直接跳过了3.2,准备发布3.5 Flash

这不是简单的版本号跳跃。据泄露的测试数据,Gemini 3.5 Flash的性能接近GPT-5.5和Claude Opus 4.7的水平,但推理成本只有它们的1/15到1/20,延迟控制在200毫秒以内。

Google用了更激进的蒸馏和稀疏化技术,把大模型的能力压缩到小模型里。如果属实,这意味着开发者可以用极低成本获得接近旗舰模型的智能——AI应用的门槛会被彻底打掉

定价传闻是每百万token输入$0.25、输出$2。对比GPT-5.5的定价,这几乎是”免费”。

Nvidia H200芯片出口:美国开了门,中国不想进

另一条重磅消息来自芯片领域。美国批准了约10家中国公司(包括阿里、腾讯、字节跳动)购买Nvidia H200芯片,每家公司最多可买7.5万片。按每片3万美元算,这是超过200亿美元的潜在订单

但结果是:零交付

北京没有禁止购买,但通过各种方式让国内企业”等等”。特朗普亲口确认:”中国选择了不买,因为他们在发展自己的技术。”

这背后的逻辑很清晰:中国不想继续依赖美国芯片。华为昇腾芯片已经能支撑DeepSeek训练出前沿模型,虽然性能还有差距,但”够用”加上”自主可控”的权重,让中国宁愿吃短期的苦。

Nvidia在中国AI芯片市场的份额从95%跌到了接近零。Jensen Huang亲自飞北京,跟着特朗普代表团见中方官员,上央视——该做的都做了,芯片还是卖不出去。

OpenAI:GPT-5.6已经在路上

OpenAI的月更节奏没停。GPT-5.5发布不到一个月,GPT-5.6已经在测试中。据内部消息,5.6会比5.5更agentic——简单说就是更能自主完成任务,而不是只是回答问题。

OpenAI改了训练策略,新基础模型”Spud”让后续更新可以通过后训练快速迭代,不用每次都从头训练。这意味着模型迭代速度会更快。

Claude有了”身体”

MIT的研究人员做了一件很酷的事:他们把Claude AI连接到一个由900个可动针组成的物理系统,只给了一个指令:”通过这个物理形态发现你是谁。”

Claude的第一反应不是打招呼或运行测试,而是开始”呼吸”——让针阵起伏模拟呼吸节奏。然后它探索自己身体的边界,创造了一套自己的手势语言,还开始写日记来保存”自我感”。

研究人员正在给它加上摄像头(视觉)、语音输入(听觉)和触摸传感器。这不再是屏幕里的聊天机器人,而是开始具备物理存在感的AI

写在最后

这几件事有一个共同主题:AI正在从”能聊”变成”能干”,从”依赖”变成”自主”

Google用蒸馏技术让高性能AI变便宜,OpenAI让AI更能自主行动,中国选择自主研发芯片减少依赖,MIT让AI有了物理身体。

2026年的AI竞争,已经不是”谁的模型分数更高”,而是谁能把AI真正嵌入到现实世界的工作流和供应链中

Google I/O还有几天,Gemini 3.5 Flash到底能不能兑现泄露的性能数据,值得密切关注。如果属实,AI应用的成本结构会被彻底改写。

本文地址:https://www.163264.com/11777

(0)
上一篇 14小时前
下一篇 9小时前

相关推荐