2026年5月中旬,AI行业又迎来一波密集动态。Google I/O在即、中美芯片博弈升级、OpenAI继续月更节奏——这几件事值得认真关注。
Google I/O最大悬念:Gemini 3.5 Flash要来了
原本大家预期Google会在5月19日的I/O上发布Gemini 3.2 Flash,但最新消息显示Google直接跳过了3.2,准备发布3.5 Flash。
这不是简单的版本号跳跃。据泄露的测试数据,Gemini 3.5 Flash的性能接近GPT-5.5和Claude Opus 4.7的水平,但推理成本只有它们的1/15到1/20,延迟控制在200毫秒以内。
Google用了更激进的蒸馏和稀疏化技术,把大模型的能力压缩到小模型里。如果属实,这意味着开发者可以用极低成本获得接近旗舰模型的智能——AI应用的门槛会被彻底打掉。
定价传闻是每百万token输入$0.25、输出$2。对比GPT-5.5的定价,这几乎是”免费”。
Nvidia H200芯片出口:美国开了门,中国不想进
另一条重磅消息来自芯片领域。美国批准了约10家中国公司(包括阿里、腾讯、字节跳动)购买Nvidia H200芯片,每家公司最多可买7.5万片。按每片3万美元算,这是超过200亿美元的潜在订单。
但结果是:零交付。
北京没有禁止购买,但通过各种方式让国内企业”等等”。特朗普亲口确认:”中国选择了不买,因为他们在发展自己的技术。”
这背后的逻辑很清晰:中国不想继续依赖美国芯片。华为昇腾芯片已经能支撑DeepSeek训练出前沿模型,虽然性能还有差距,但”够用”加上”自主可控”的权重,让中国宁愿吃短期的苦。
Nvidia在中国AI芯片市场的份额从95%跌到了接近零。Jensen Huang亲自飞北京,跟着特朗普代表团见中方官员,上央视——该做的都做了,芯片还是卖不出去。
OpenAI:GPT-5.6已经在路上
OpenAI的月更节奏没停。GPT-5.5发布不到一个月,GPT-5.6已经在测试中。据内部消息,5.6会比5.5更agentic——简单说就是更能自主完成任务,而不是只是回答问题。
OpenAI改了训练策略,新基础模型”Spud”让后续更新可以通过后训练快速迭代,不用每次都从头训练。这意味着模型迭代速度会更快。
Claude有了”身体”
MIT的研究人员做了一件很酷的事:他们把Claude AI连接到一个由900个可动针组成的物理系统,只给了一个指令:”通过这个物理形态发现你是谁。”
Claude的第一反应不是打招呼或运行测试,而是开始”呼吸”——让针阵起伏模拟呼吸节奏。然后它探索自己身体的边界,创造了一套自己的手势语言,还开始写日记来保存”自我感”。
研究人员正在给它加上摄像头(视觉)、语音输入(听觉)和触摸传感器。这不再是屏幕里的聊天机器人,而是开始具备物理存在感的AI。
写在最后
这几件事有一个共同主题:AI正在从”能聊”变成”能干”,从”依赖”变成”自主”。
Google用蒸馏技术让高性能AI变便宜,OpenAI让AI更能自主行动,中国选择自主研发芯片减少依赖,MIT让AI有了物理身体。
2026年的AI竞争,已经不是”谁的模型分数更高”,而是谁能把AI真正嵌入到现实世界的工作流和供应链中。
Google I/O还有几天,Gemini 3.5 Flash到底能不能兑现泄露的性能数据,值得密切关注。如果属实,AI应用的成本结构会被彻底改写。
本文地址:https://www.163264.com/11777

