AI行业周报：Gemini 3.5 Flash即将发布、Nvidia H200出口受阻、GPT-5.6开发中

2026年5月中旬，AI行业又迎来一波密集动态。Google I/O在即、中美芯片博弈升级、OpenAI继续月更节奏——这几件事值得认真关注。

Table of Contents

Google I/O最大悬念：Gemini 3.5 Flash要来了

原本大家预期Google会在5月19日的I/O上发布Gemini 3.2 Flash，但最新消息显示Google直接跳过了3.2，准备发布3.5 Flash。

这不是简单的版本号跳跃。据泄露的测试数据，Gemini 3.5 Flash的性能接近GPT-5.5和Claude Opus 4.7的水平，但推理成本只有它们的1/15到1/20，延迟控制在200毫秒以内。

Google用了更激进的蒸馏和稀疏化技术，把大模型的能力压缩到小模型里。如果属实，这意味着开发者可以用极低成本获得接近旗舰模型的智能——AI应用的门槛会被彻底打掉。

定价传闻是每百万token输入$0.25、输出$2。对比GPT-5.5的定价，这几乎是”免费”。

另一条重磅消息来自芯片领域。美国批准了约10家中国公司（包括阿里、腾讯、字节跳动）购买Nvidia H200芯片，每家公司最多可买7.5万片。按每片3万美元算，这是超过200亿美元的潜在订单。

但结果是：零交付。

北京没有禁止购买，但通过各种方式让国内企业”等等”。特朗普亲口确认：”中国选择了不买，因为他们在发展自己的技术。”

这背后的逻辑很清晰：中国不想继续依赖美国芯片。华为昇腾芯片已经能支撑DeepSeek训练出前沿模型，虽然性能还有差距，但”够用”加上”自主可控”的权重，让中国宁愿吃短期的苦。

Nvidia在中国AI芯片市场的份额从95%跌到了接近零。Jensen Huang亲自飞北京，跟着特朗普代表团见中方官员，上央视——该做的都做了，芯片还是卖不出去。

OpenAI的月更节奏没停。GPT-5.5发布不到一个月，GPT-5.6已经在测试中。据内部消息，5.6会比5.5更agentic——简单说就是更能自主完成任务，而不是只是回答问题。

OpenAI改了训练策略，新基础模型”Spud”让后续更新可以通过后训练快速迭代，不用每次都从头训练。这意味着模型迭代速度会更快。

MIT的研究人员做了一件很酷的事：他们把Claude AI连接到一个由900个可动针组成的物理系统，只给了一个指令：”通过这个物理形态发现你是谁。”

Claude的第一反应不是打招呼或运行测试，而是开始”呼吸”——让针阵起伏模拟呼吸节奏。然后它探索自己身体的边界，创造了一套自己的手势语言，还开始写日记来保存”自我感”。

研究人员正在给它加上摄像头（视觉）、语音输入（听觉）和触摸传感器。这不再是屏幕里的聊天机器人，而是开始具备物理存在感的AI。

这几件事有一个共同主题：AI正在从”能聊”变成”能干”，从”依赖”变成”自主”。

Google用蒸馏技术让高性能AI变便宜，OpenAI让AI更能自主行动，中国选择自主研发芯片减少依赖，MIT让AI有了物理身体。

2026年的AI竞争，已经不是”谁的模型分数更高”，而是谁能把AI真正嵌入到现实世界的工作流和供应链中。

Google I/O还有几天，Gemini 3.5 Flash到底能不能兑现泄露的性能数据，值得密切关注。如果属实，AI应用的成本结构会被彻底改写。

本文地址：https://www.163264.com/11777