AI日报|豆包音频模型1.0登场,Cursor自研大模型,企业微信AI Agent内测

豆包音频生成模型

今天AI圈又热闹了。豆包、Cursor、企业微信、OpenAI、阿里云、即梦AI轮番上场,从音频生成到代码安全,从办公提效到视频4K,各家都在秀肌肉。来,快速过一遍今天值得关注的动态。

豆包音频生成模型1.0:普通人也能当”音频导演”

字节跳动的豆包团队今天正式推出了音频生成模型1.0。这不是简单的文字转语音,而是能让你输入一段描述,直接生成一段完整的、有情绪、有角色的音频成片。

核心技术就两个:

  • 多模态参考生成:你可以给它参考音频、参考音色,甚至参考风格,它能把这些元素融合在一起,生成你想要的声音
  • 长时音色一致性:以前AI配音最大的问题是一会儿像A一会儿像B,现在这个问题被解决了,角色不会”串戏”

简单说,以前做一段专业音频需要录音棚、配音演员、后期剪辑,现在你只需要写几句话。这对播客、有声书、游戏配音这些场景来说,门槛直接砍到脚踝。

Cursor不再只是编辑器,开始自研大模型了

AI编程工具Cursor今天放了个大招——发布了首个完全自主训练的大模型。这意味着Cursor不再是”套壳”,而是有了自己的”大脑”。

同时推出的还有两个新东西:

  • Origin Git平台:一个支持AI Agent协同的代码托管平台,AI可以自己提交代码、Review、合并
  • Cursor Mobile iOS测试版:手机上也能远程管理AI Agent,出门路上也能盯着代码跑

Cursor的野心很明显——从”好用的代码编辑器”变成”完整的开发者生态”。

企业微信内测AI Agent”大圆”:办公场景的”全能秘书”

腾讯企业微信开始内测一个叫做“大圆”的AI Agent。它的特别之处在于不是独立App,而是直接嵌在企业微信里

向左一滑就能唤醒,它能:

  • 自动总结群聊讨论,提炼重点
  • 读取复杂报表,直接告诉你结论
  • 根据聊天记录自动生成回复建议
  • 理解销售、客服与客户的沟通记录,提取关键信息

它背后的数据来源是企业微信里沉淀的群聊、文档、会议、邮件、日程——也就是说,它真的”懂”你们公司每天在忙什么。

即梦AI Seedance 2.0 VIP:原生4K视频来了

即梦AI今天给Seedance 2.0 VIP版本上了原生4K功能。注意是”原生”,不是把1080P放大到4K那种套路,而是直接以4K分辨率渲染。

这意味着画面细节、色彩层次、光影精度都有质的提升。对于影视后期、品牌广告这些专业场景来说,AI视频工具的可用性又上了一个台阶。

豆包2.1专业版发布:能操控你电脑的AI员工

豆包2.1专业版今天也来了。接入Pro模型后,它的能力从”聊天”升级到了”干活”——可以操作你的本地电脑、使用浏览器、执行定时任务。

定价分三档,还有教育优惠。字节这是在推”AI数字员工”的概念了。

特斯拉车机接入豆包:语音助手变聪明了

最后一条——特斯拉中国宣布车机系统将通过OTA升级接入豆包大模型。语音助手会采用”分工协作”模式:豆包负责硬件控制指令,DeepSeek处理复杂对话。

以后对着特斯拉说”我有点冷”,它可能真的懂你什么意思。


今天这几条里,你最关注哪个?评论区聊聊。

本文地址:https://www.163264.com/13349

(0)
上一篇 5小时前
OpenAI发布GPT-5.5-Cyber:不仅能找漏洞,还能自动打补丁
下一篇 1小时前

相关推荐