📅 2026年6月6日 · 星期六 | 本日报由 AI 自动整理
今天是2026年6月6日,AI行业迎来多个重磅消息。Ideogram 4.0开源发布,成为最强文字生成AI;OpenAI升级ChatGPT记忆系统,算力降至1/5;NBA中国携手阿里千问上线首个官方大模型;xAI发布Grok Imagine Video 1.5图转视频模型;DeepSeek首次登顶美国B2B软件趋势榜。以下是今日详细报道。
📑 今日目录
🎯 今日核心要点
| 要点 | 一句话说明 | 重要度 |
|---|---|---|
| Ideogram 4.0开源发布 | 93亿参数打造最强文字生成AI,DesignArena全球第四,开源图像生成领域新标杆 | ⭐⭐⭐⭐⭐ |
| OpenAI升级ChatGPT记忆系统 | Dreaming V3机制解决记忆过时与准确性痛点,算力降至1/5,免费用户也能用 | ⭐⭐⭐⭐⭐ |
| NBA中国×阿里千问官方大模型上线 | 首个NBA官方大模型NBA Chat,基于千问开发,深度融合NBA历史数据与球员分析 | ⭐⭐⭐⭐ |
| DeepSeek登顶美国B2B趋势榜 | API降价75%后性价比优势凸显,美国企业AI成本飙升转向低成本替代方案 | ⭐⭐⭐⭐ |
| xAI发布Grok Imagine Video 1.5 | 单图生成720p电影感视频,直面Google Veo竞争,开发者可通过API接入 | ⭐⭐⭐⭐ |
| 腾讯文档发布「人机双写」 | 行业首创人与AI实时同屏协作,原生接入WorkBuddy构建AI原生编辑器 | ⭐⭐⭐ |
🧠 大模型进展
🔴 国内动态
NBA中国携手阿里巴巴上线首个官方大模型「NBA Chat」
NBA中国与阿里巴巴合作推出的首个官方大模型「NBA Chat」正式上线。该模型基于阿里千问大模型开发,深度融合了NBA比赛历史数据、球员深度分析、篮球规则等多维专业信息,可为球迷提供智能篮球问答服务,包括解读球员位置、得分等核心数据。后续将持续升级Agent能力,为体育赛事数字化转型注入新动力。此次合作展示了国产大模型在垂直场景中的高效交付能力,预示着体育消费生态正加速走向智能化重塑。
来源:IT之家 | 站长之家
腾讯文档行业首发「人机双写」,原生接入WorkBuddy
腾讯文档在2026腾讯云AI产业应用大会上宣布全面升级,推出行业首创的「人机双写」能力。该功能结合自研高性能编辑引擎与专业Skill,实现用户与AI实时同屏协作,AI可进行文字填充、数据清洗、图表生成等操作。腾讯文档作为核心组件深度内嵌至WorkBuddy中,推动执行式AI发展,标志着其从传统编辑工具进化为人与AI协作的新一代内容平台。
来源:站长之家
腾讯云ADP 4.0发布:Claw模式让Agent一句话生成
腾讯云ADP 4.0版本发布,新增Claw模式,支持复杂任务的Agent构建与运行,通过Connector、Skills等方式打通企业系统与工具。同时强化安全治理,覆盖Agent全生命周期,助力企业Agent规模化落地。
来源:站长之家
知乎Q1靠「省钱」扭亏为盈,AI漫剧成核心增长点
知乎Q1财报显示营收下滑但实现扭亏为盈,AI短剧和漫剧成为核心增长点。但行业竞争激烈,知乎盈利仍依赖成本控制,AI内容能否扛起增收大旗有待观察。
来源:站长之家
我国发布全球海洋现象智能预报大模型「琅琊」2.0
中国科学院海洋研究所发布「琅琊」2.0大模型,在1.0基础上从海洋状态变量预报拓展至台风、降水、风暴潮等复杂海洋现象智能预报,构建多场景、体系化预测能力,为海洋防灾减灾、航运安全等提供智能化科技支撑。
来源:IT之家
腾讯内部调整AI Token额度:按工作任务动态调配
腾讯内部调整AI Token使用策略,改为按工作任务动态调配,看产出不看消耗。通知明确表示总投入只增不减,对能用AI带来显著提效和价值产出的同学保障Token额度,不搞Token消耗量排名,不贩卖焦虑。
来源:IT之家
华为云联合20余家模型厂商发布生态合作计划
华为云联合智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、讯飞星火等20余家TOP模型厂商,发布「百模千态,云聚共赢」生态合作计划,共建系统化商业生态。
来源:IT之家
🔵 海外动态
Ideogram 4.0开源发布:93亿参数打造最强文字生成AI
Ideogram 4.0正式开源发布,采用单流架构提升文本与视觉内容协同生成能力,强化文字渲染能力解决传统文生图模型文字错乱问题,引入边界框数据增强版式控制能力。该模型在DesignArena排名全球第四,成为海报制作、品牌营销和视觉内容创作领域的新选择。
来源:GitHub | 站长之家
OpenAI升级ChatGPT记忆系统:算力降至1/5
OpenAI对ChatGPT记忆功能进行重大架构升级,推出基于Dreaming V3机制的新系统。该系统解决记忆过时和准确性不足的问题,可自动更新用户个人资料并以摘要形式展示重要生活细节与偏好。算力消耗降低至原来的五分之一,使免费用户也能享受先进记忆功能。
来源:站长之家
xAI发布Grok Imagine Video 1.5:单图生成720p视频
马斯克旗下xAI宣布通过API开放预览版图像转视频模型grok-imagine-video-1.5-preview。用户上传一张图片并提供文本提示,即可生成最高720p分辨率、具有电影感的动态视频。这标志着xAI在AI视频生成领域直面Google Veo竞争。
来源:IT之家
DeepSeek首次登顶美国B2B软件趋势榜
美国企业正面临AI模型推理成本飙升困境,累计投入超1万亿美元却难见降本增效。企业开始寻求低成本替代方案,DeepSeek首次登上美国企业软件趋势榜榜首,API价格下调75%后性价比优势凸显。
来源:IT之家
微软CEO纳德拉要为公司内部智能体「管起来」
微软CEO萨提亚·纳德拉表示,公司正在梳理所需工具和政策,以便监管内部创建的所有AI智能体。具体做法包括为AI智能体设定身份和权限边界,明确在微软内部哪些内容可以访问、哪些不能访问,同时建立审计工作成果的机制。
来源:IT之家
软银孙正义:ASI未来2年到来,比人类聪明1万倍
软银CEO孙正义在接受CNBC采访时表示,OpenAI正在推进「AI开发AI」,AI参与设计后续模型。他认为AI正逼近ASI(人工超级智能),并把到来时间从10年缩短至2年。
来源:IT之家
谷歌月付9.2亿美元租赁马斯克SpaceX算力
谷歌和SpaceX达成云计算合作,计划自2026年10月起至2029年6月,每月向SpaceX支付9.2亿美元(约合62.46亿元人民币),用于租用约11万英伟达GPU等数据中心算力资源。
来源:IT之家
谷歌推出Magenta RealTime 2本地实时音乐AI模型
谷歌Magenta团队发布Magenta RealTime 2(MRT2)模型,延迟降低至前代的1/15,并同步免费放出乐器应用Jam及DAW插件MRT2,为音乐创作者提供低延迟AI辅助创作工具。
来源:IT之家
谷歌为Android Go带来Gemini Go精简版AI助手
谷歌宣布为Android Go系统带来精简版AI助手Gemini Go,取代Google Assistant Go。支持拨打电话、查询地图、设置闹钟等日常任务,还能通过上传文档获取上下文。2GB内存以上的入门级手机即可使用,已开始分阶段推送。
来源:IT之家
Meta借鉴特斯拉在帐篷里建造数据中心
为把建设周期缩短一半,Meta已在俄亥俄州新奥尔巴尼市外搭建6座帐篷(被称为「快速部署结构」)建造数据中心。这种临时建筑方式此前特斯拉曾用于加速产能扩张。
来源:IT之家
Anthropic被曝雇1000名人类工程师训练Claude Code
Anthropic在数据标注公司Snorkel AI内部开展名为「Marlin」的项目,雇佣约1000名人类工程师训练Claude Code,每项任务支付280美元。核心在于微调Claude Code的回答,使其更接近专业开发人员的真实工作方式。
来源:IT之家
美国政府与OpenAI谈持股方案,磋商已超1年
美国政府与OpenAI正讨论一项潜在股权安排,核心方向是由OpenAI向美国政府捐赠部分股权,作为类似「公共财富基金」的种子资产,让公众间接分享AI增长收益。
来源:IT之家
🎬 AI内容创作
男子用AI写歌月入十几万:40秒生成一首歌
浙江杭州一名从业者借助AI音乐创作工具实现可观收益。上传一张图片,耗时40秒便能生成一首完整曲目,人声、唱腔还原度贴近真人演唱,普通听众难以区分。依托低成本批量制作AI歌曲投放到音乐、短视频平台变现,月收入可达十几万元。同时提醒公众防范AI声音克隆诈骗——不法分子只需截取5秒通话音频就能复刻声线,已有受害者10分钟内被骗430万元。
来源:站长之家
快手可灵AI全球用户突破1亿
快手旗下可灵AI宣布全球用户突破1亿,企业客户近5万。发布两年即达到这一里程碑,显示AI视频生成工具在内容创作者中的渗透率持续提升。
来源:IT之家
腾讯混元提出Stem稀疏注意力算法,首字延迟降低3.6倍
腾讯混元宣布提出Stem稀疏注意力算法,已被机器学习顶会ICML-26收录。该算法显著降低大模型首字延迟,提升推理效率。
来源:IT之家
🛡️ 平台治理与合规
OpenAI为所有ChatGPT个人用户开放锁定模式
OpenAI为所有ChatGPT个人用户开放锁定模式,启用后可限制网页浏览、深度研究等功能,降低数据泄露风险。但OpenAI坦承该模式无法完全阻止提示词注入攻击。该功能今年2月已面向企业用户推出。
来源:IT之家
抖音副总裁回应「豆包误判蘑菇致用户中毒」
针对网传「豆包误判蘑菇致用户中毒」,抖音副总裁李亮回应称,豆包在识别为鸡腿菇的同时已明确提示其易与剧毒蘑菇混淆,并强烈不建议食用。他强调AI仍在发展阶段,涉及人身安全的问题AI回答仅供参考,务必多方求证。
来源:IT之家 | 站长之家
2026世界杯扩大AI审核:实时过滤超3万个关键词
2026年世界杯足球比赛期间,国际足联扩大AI社交媒体保护服务,实时过滤超3万个关键词,2秒隐藏不当评论,用来减少球员和球队看到的辱骂内容。
来源:IT之家
微软MAI系列AI模型训练数据曝光,「仅商业授权」说法存出入
科技媒体The Decoder报道称,微软最新发布的MAI系列AI模型部分使用未获授权的开放网络数据训练,与其此前「仅采用企业级、干净且商业授权数据」的说法不一致。
来源:IT之家
比亚迪辟谣「人形机器人代号尧舜禹」等消息
针对网传比亚迪自研人形机器人代号「尧舜禹」、第七代原型机在工厂测试及年内部署2万台等消息,比亚迪官方明确否认。但公司执行副总裁李柯此前确认了比亚迪正在开发人形机器人,并探讨商业化路径。
来源:IT之家
日本数字大臣警告:日本若跟不上发展恐沦为「AI殖民地」
日本数字大臣松本尚警告称,若日本在AI领域持续落后,将面临沦为「AI殖民地」的风险。他提出需修改《个人信息保护法》,允许在特定情况下无需用户同意即可使用数据,引发在野党对隐私保护的担忧。
来源:IT之家
🔮 趋势洞察
1. 开源模型正在重新定义图像生成格局
Ideogram 4.0开源发布标志着高质量图像生成模型走向开放。93亿参数、最强文字生成能力、版式控制——这些特性此前多为闭源产品独占。开源与闭源的差距正在快速缩小,创作者和开发者将获得更多自由。
2. 记忆系统成为大模型竞争新维度
OpenAI升级ChatGPT记忆系统,算力降至1/5且向免费用户开放。记忆能力直接影响AI助手的实用性和用户粘性,未来可能成为与推理能力、多模态并列的核心竞争力。
3. 垂直场景大模型落地加速
NBA Chat基于千问开发,深度融合体育数据;琅琊2.0专注海洋预报。垂直场景大模型不再需要从头训练,基于通用大模型+领域数据微调的模式正在成熟。
4. 美国企业AI成本困境催生DeepSeek机会
美国企业AI投入超1万亿美元却难见降本增效,DeepSeek凭借API降价75%的性价比优势首次登顶B2B趋势榜。这验证了中国大模型在全球市场的竞争力,也预示着AI推理成本将成为企业选型核心因素。
5. 端侧AI与轻量化部署成为新方向
谷歌为Android Go带来Gemini Go,2GB内存手机即可使用AI助手;腾讯混元Stem算法降低首字延迟3.6倍。端侧AI正在从旗舰设备向中低端设备渗透,轻量化部署成为技术攻关重点。
💡 今日行动建议
- 关注Ideogram 4.0:开源+最强文字生成,适合海报、品牌营销、视觉内容创作,开发者可接入GitHub体验
- 体验NBA Chat:如果你是体育/篮球爱好者,测试首个NBA官方大模型的问答能力,观察垂直场景大模型的表现
- 防范AI声音诈骗:接到陌生来电尽量少透露语音信息,5秒音频即可被克隆声线,已有430万元被骗案例
- 关注DeepSeek出海:如果你是B端企业决策者,DeepSeek的性价比优势值得评估,特别是API调用成本敏感场景
- 尝试AI音乐创作:40秒生成一首歌,月入十几万的案例说明AI音乐变现路径已跑通,但需注意平台规则和版权风险
- 评估ChatGPT锁定模式:如果你处理敏感数据,启用锁定模式可降低泄露风险,但需了解其无法完全阻止提示词注入
📰 AI行业日报 · 每日自动整理 · 数据来源:站长之家、IT之家
💡 提示:点击文中链接查看原文详情
本文地址:https://www.163264.com/12683


微信扫一扫,鼓励一下~