AI 行业日报 · 2026年6月6日 | Ideogram 4.0开源 OpenAI升级记忆系统 NBA Chat上线

📅 2026年6月6日 · 星期六 | 本日报由 AI 自动整理

今天是2026年6月6日，AI行业迎来多个重磅消息。Ideogram 4.0开源发布，成为最强文字生成AI；OpenAI升级ChatGPT记忆系统，算力降至1/5；NBA中国携手阿里千问上线首个官方大模型；xAI发布Grok Imagine Video 1.5图转视频模型；DeepSeek首次登顶美国B2B软件趋势榜。以下是今日详细报道。

Table of Contents

📑 今日目录

🎯 今日核心要点
🧠 大模型进展
- 🔴 国内动态
- 🔵 海外动态
🎬 AI内容创作
🛡️ 平台治理与合规
🔮 趋势洞察
💡 今日行动建议

🎯 今日核心要点

要点	一句话说明	重要度
Ideogram 4.0开源发布	93亿参数打造最强文字生成AI，DesignArena全球第四，开源图像生成领域新标杆	⭐⭐⭐⭐⭐
OpenAI升级ChatGPT记忆系统	Dreaming V3机制解决记忆过时与准确性痛点，算力降至1/5，免费用户也能用	⭐⭐⭐⭐⭐
NBA中国×阿里千问官方大模型上线	首个NBA官方大模型NBA Chat，基于千问开发，深度融合NBA历史数据与球员分析	⭐⭐⭐⭐
DeepSeek登顶美国B2B趋势榜	API降价75%后性价比优势凸显，美国企业AI成本飙升转向低成本替代方案	⭐⭐⭐⭐
xAI发布Grok Imagine Video 1.5	单图生成720p电影感视频，直面Google Veo竞争，开发者可通过API接入	⭐⭐⭐⭐
腾讯文档发布「人机双写」	行业首创人与AI实时同屏协作，原生接入WorkBuddy构建AI原生编辑器	⭐⭐⭐

🧠 大模型进展

🔴 国内动态

NBA中国携手阿里巴巴上线首个官方大模型「NBA Chat」

NBA中国与阿里巴巴合作推出的首个官方大模型「NBA Chat」正式上线。该模型基于阿里千问大模型开发，深度融合了NBA比赛历史数据、球员深度分析、篮球规则等多维专业信息，可为球迷提供智能篮球问答服务，包括解读球员位置、得分等核心数据。后续将持续升级Agent能力，为体育赛事数字化转型注入新动力。此次合作展示了国产大模型在垂直场景中的高效交付能力，预示着体育消费生态正加速走向智能化重塑。
来源：IT之家 | 站长之家

腾讯文档行业首发「人机双写」，原生接入WorkBuddy

腾讯文档在2026腾讯云AI产业应用大会上宣布全面升级，推出行业首创的「人机双写」能力。该功能结合自研高性能编辑引擎与专业Skill，实现用户与AI实时同屏协作，AI可进行文字填充、数据清洗、图表生成等操作。腾讯文档作为核心组件深度内嵌至WorkBuddy中，推动执行式AI发展，标志着其从传统编辑工具进化为人与AI协作的新一代内容平台。
来源：站长之家

腾讯云ADP 4.0发布：Claw模式让Agent一句话生成

腾讯云ADP 4.0版本发布，新增Claw模式，支持复杂任务的Agent构建与运行，通过Connector、Skills等方式打通企业系统与工具。同时强化安全治理，覆盖Agent全生命周期，助力企业Agent规模化落地。
来源：站长之家

知乎Q1靠「省钱」扭亏为盈，AI漫剧成核心增长点

知乎Q1财报显示营收下滑但实现扭亏为盈，AI短剧和漫剧成为核心增长点。但行业竞争激烈，知乎盈利仍依赖成本控制，AI内容能否扛起增收大旗有待观察。
来源：站长之家

我国发布全球海洋现象智能预报大模型「琅琊」2.0

中国科学院海洋研究所发布「琅琊」2.0大模型，在1.0基础上从海洋状态变量预报拓展至台风、降水、风暴潮等复杂海洋现象智能预报，构建多场景、体系化预测能力，为海洋防灾减灾、航运安全等提供智能化科技支撑。
来源：IT之家

腾讯内部调整AI Token额度：按工作任务动态调配

腾讯内部调整AI Token使用策略，改为按工作任务动态调配，看产出不看消耗。通知明确表示总投入只增不减，对能用AI带来显著提效和价值产出的同学保障Token额度，不搞Token消耗量排名，不贩卖焦虑。
来源：IT之家

华为云联合20余家模型厂商发布生态合作计划

华为云联合智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、讯飞星火等20余家TOP模型厂商，发布「百模千态，云聚共赢」生态合作计划，共建系统化商业生态。
来源：IT之家

🔵 海外动态

Ideogram 4.0开源发布：93亿参数打造最强文字生成AI

Ideogram 4.0正式开源发布，采用单流架构提升文本与视觉内容协同生成能力，强化文字渲染能力解决传统文生图模型文字错乱问题，引入边界框数据增强版式控制能力。该模型在DesignArena排名全球第四，成为海报制作、品牌营销和视觉内容创作领域的新选择。
来源：GitHub | 站长之家

OpenAI升级ChatGPT记忆系统：算力降至1/5

OpenAI对ChatGPT记忆功能进行重大架构升级，推出基于Dreaming V3机制的新系统。该系统解决记忆过时和准确性不足的问题，可自动更新用户个人资料并以摘要形式展示重要生活细节与偏好。算力消耗降低至原来的五分之一，使免费用户也能享受先进记忆功能。
来源：站长之家

xAI发布Grok Imagine Video 1.5：单图生成720p视频

马斯克旗下xAI宣布通过API开放预览版图像转视频模型grok-imagine-video-1.5-preview。用户上传一张图片并提供文本提示，即可生成最高720p分辨率、具有电影感的动态视频。这标志着xAI在AI视频生成领域直面Google Veo竞争。
来源：IT之家

DeepSeek首次登顶美国B2B软件趋势榜

美国企业正面临AI模型推理成本飙升困境，累计投入超1万亿美元却难见降本增效。企业开始寻求低成本替代方案，DeepSeek首次登上美国企业软件趋势榜榜首，API价格下调75%后性价比优势凸显。
来源：IT之家

微软CEO纳德拉要为公司内部智能体「管起来」

微软CEO萨提亚·纳德拉表示，公司正在梳理所需工具和政策，以便监管内部创建的所有AI智能体。具体做法包括为AI智能体设定身份和权限边界，明确在微软内部哪些内容可以访问、哪些不能访问，同时建立审计工作成果的机制。
来源：IT之家

软银孙正义：ASI未来2年到来，比人类聪明1万倍

软银CEO孙正义在接受CNBC采访时表示，OpenAI正在推进「AI开发AI」，AI参与设计后续模型。他认为AI正逼近ASI（人工超级智能），并把到来时间从10年缩短至2年。
来源：IT之家

谷歌月付9.2亿美元租赁马斯克SpaceX算力

谷歌和SpaceX达成云计算合作，计划自2026年10月起至2029年6月，每月向SpaceX支付9.2亿美元（约合62.46亿元人民币），用于租用约11万英伟达GPU等数据中心算力资源。
来源：IT之家

谷歌推出Magenta RealTime 2本地实时音乐AI模型

谷歌Magenta团队发布Magenta RealTime 2（MRT2）模型，延迟降低至前代的1/15，并同步免费放出乐器应用Jam及DAW插件MRT2，为音乐创作者提供低延迟AI辅助创作工具。
来源：IT之家

谷歌为Android Go带来Gemini Go精简版AI助手

谷歌宣布为Android Go系统带来精简版AI助手Gemini Go，取代Google Assistant Go。支持拨打电话、查询地图、设置闹钟等日常任务，还能通过上传文档获取上下文。2GB内存以上的入门级手机即可使用，已开始分阶段推送。
来源：IT之家

Meta借鉴特斯拉在帐篷里建造数据中心

为把建设周期缩短一半，Meta已在俄亥俄州新奥尔巴尼市外搭建6座帐篷（被称为「快速部署结构」）建造数据中心。这种临时建筑方式此前特斯拉曾用于加速产能扩张。
来源：IT之家

Anthropic被曝雇1000名人类工程师训练Claude Code

Anthropic在数据标注公司Snorkel AI内部开展名为「Marlin」的项目，雇佣约1000名人类工程师训练Claude Code，每项任务支付280美元。核心在于微调Claude Code的回答，使其更接近专业开发人员的真实工作方式。
来源：IT之家

美国政府与OpenAI谈持股方案，磋商已超1年

美国政府与OpenAI正讨论一项潜在股权安排，核心方向是由OpenAI向美国政府捐赠部分股权，作为类似「公共财富基金」的种子资产，让公众间接分享AI增长收益。
来源：IT之家

🎬 AI内容创作

男子用AI写歌月入十几万：40秒生成一首歌

浙江杭州一名从业者借助AI音乐创作工具实现可观收益。上传一张图片，耗时40秒便能生成一首完整曲目，人声、唱腔还原度贴近真人演唱，普通听众难以区分。依托低成本批量制作AI歌曲投放到音乐、短视频平台变现，月收入可达十几万元。同时提醒公众防范AI声音克隆诈骗——不法分子只需截取5秒通话音频就能复刻声线，已有受害者10分钟内被骗430万元。
来源：站长之家

快手可灵AI全球用户突破1亿

快手旗下可灵AI宣布全球用户突破1亿，企业客户近5万。发布两年即达到这一里程碑，显示AI视频生成工具在内容创作者中的渗透率持续提升。
来源：IT之家

腾讯混元提出Stem稀疏注意力算法，首字延迟降低3.6倍

腾讯混元宣布提出Stem稀疏注意力算法，已被机器学习顶会ICML-26收录。该算法显著降低大模型首字延迟，提升推理效率。
来源：IT之家

🛡️ 平台治理与合规

OpenAI为所有ChatGPT个人用户开放锁定模式

OpenAI为所有ChatGPT个人用户开放锁定模式，启用后可限制网页浏览、深度研究等功能，降低数据泄露风险。但OpenAI坦承该模式无法完全阻止提示词注入攻击。该功能今年2月已面向企业用户推出。
来源：IT之家

抖音副总裁回应「豆包误判蘑菇致用户中毒」

针对网传「豆包误判蘑菇致用户中毒」，抖音副总裁李亮回应称，豆包在识别为鸡腿菇的同时已明确提示其易与剧毒蘑菇混淆，并强烈不建议食用。他强调AI仍在发展阶段，涉及人身安全的问题AI回答仅供参考，务必多方求证。
来源：IT之家 | 站长之家

2026世界杯扩大AI审核：实时过滤超3万个关键词

2026年世界杯足球比赛期间，国际足联扩大AI社交媒体保护服务，实时过滤超3万个关键词，2秒隐藏不当评论，用来减少球员和球队看到的辱骂内容。
来源：IT之家

微软MAI系列AI模型训练数据曝光，「仅商业授权」说法存出入

科技媒体The Decoder报道称，微软最新发布的MAI系列AI模型部分使用未获授权的开放网络数据训练，与其此前「仅采用企业级、干净且商业授权数据」的说法不一致。
来源：IT之家

比亚迪辟谣「人形机器人代号尧舜禹」等消息

针对网传比亚迪自研人形机器人代号「尧舜禹」、第七代原型机在工厂测试及年内部署2万台等消息，比亚迪官方明确否认。但公司执行副总裁李柯此前确认了比亚迪正在开发人形机器人，并探讨商业化路径。
来源：IT之家

日本数字大臣警告：日本若跟不上发展恐沦为「AI殖民地」

日本数字大臣松本尚警告称，若日本在AI领域持续落后，将面临沦为「AI殖民地」的风险。他提出需修改《个人信息保护法》，允许在特定情况下无需用户同意即可使用数据，引发在野党对隐私保护的担忧。
来源：IT之家

🔮 趋势洞察

1. 开源模型正在重新定义图像生成格局

Ideogram 4.0开源发布标志着高质量图像生成模型走向开放。93亿参数、最强文字生成能力、版式控制——这些特性此前多为闭源产品独占。开源与闭源的差距正在快速缩小，创作者和开发者将获得更多自由。

2. 记忆系统成为大模型竞争新维度

OpenAI升级ChatGPT记忆系统，算力降至1/5且向免费用户开放。记忆能力直接影响AI助手的实用性和用户粘性，未来可能成为与推理能力、多模态并列的核心竞争力。

3. 垂直场景大模型落地加速

NBA Chat基于千问开发，深度融合体育数据；琅琊2.0专注海洋预报。垂直场景大模型不再需要从头训练，基于通用大模型+领域数据微调的模式正在成熟。

4. 美国企业AI成本困境催生DeepSeek机会

美国企业AI投入超1万亿美元却难见降本增效，DeepSeek凭借API降价75%的性价比优势首次登顶B2B趋势榜。这验证了中国大模型在全球市场的竞争力，也预示着AI推理成本将成为企业选型核心因素。

5. 端侧AI与轻量化部署成为新方向

谷歌为Android Go带来Gemini Go，2GB内存手机即可使用AI助手；腾讯混元Stem算法降低首字延迟3.6倍。端侧AI正在从旗舰设备向中低端设备渗透，轻量化部署成为技术攻关重点。

💡 今日行动建议

关注Ideogram 4.0：开源+最强文字生成，适合海报、品牌营销、视觉内容创作，开发者可接入GitHub体验
体验NBA Chat：如果你是体育/篮球爱好者，测试首个NBA官方大模型的问答能力，观察垂直场景大模型的表现
防范AI声音诈骗：接到陌生来电尽量少透露语音信息，5秒音频即可被克隆声线，已有430万元被骗案例
关注DeepSeek出海：如果你是B端企业决策者，DeepSeek的性价比优势值得评估，特别是API调用成本敏感场景
尝试AI音乐创作：40秒生成一首歌，月入十几万的案例说明AI音乐变现路径已跑通，但需注意平台规则和版权风险
评估ChatGPT锁定模式：如果你处理敏感数据，启用锁定模式可降低泄露风险，但需了解其无法完全阻止提示词注入

📰 AI行业日报 · 每日自动整理 · 数据来源：站长之家、IT之家
💡 提示：点击文中链接查看原文详情

本文地址：https://www.163264.com/12683