
今天AI圈又热闹了。豆包、Cursor、企业微信、OpenAI、阿里云、即梦AI轮番上场,从音频生成到代码安全,从办公提效到视频4K,各家都在秀肌肉。来,快速过一遍今天值得关注的动态。
豆包音频生成模型1.0:普通人也能当”音频导演”
字节跳动的豆包团队今天正式推出了音频生成模型1.0。这不是简单的文字转语音,而是能让你输入一段描述,直接生成一段完整的、有情绪、有角色的音频成片。
核心技术就两个:
- 多模态参考生成:你可以给它参考音频、参考音色,甚至参考风格,它能把这些元素融合在一起,生成你想要的声音
- 长时音色一致性:以前AI配音最大的问题是一会儿像A一会儿像B,现在这个问题被解决了,角色不会”串戏”
简单说,以前做一段专业音频需要录音棚、配音演员、后期剪辑,现在你只需要写几句话。这对播客、有声书、游戏配音这些场景来说,门槛直接砍到脚踝。
Cursor不再只是编辑器,开始自研大模型了
AI编程工具Cursor今天放了个大招——发布了首个完全自主训练的大模型。这意味着Cursor不再是”套壳”,而是有了自己的”大脑”。
同时推出的还有两个新东西:
- Origin Git平台:一个支持AI Agent协同的代码托管平台,AI可以自己提交代码、Review、合并
- Cursor Mobile iOS测试版:手机上也能远程管理AI Agent,出门路上也能盯着代码跑
Cursor的野心很明显——从”好用的代码编辑器”变成”完整的开发者生态”。
企业微信内测AI Agent”大圆”:办公场景的”全能秘书”
腾讯企业微信开始内测一个叫做“大圆”的AI Agent。它的特别之处在于不是独立App,而是直接嵌在企业微信里。
向左一滑就能唤醒,它能:
- 自动总结群聊讨论,提炼重点
- 读取复杂报表,直接告诉你结论
- 根据聊天记录自动生成回复建议
- 理解销售、客服与客户的沟通记录,提取关键信息
它背后的数据来源是企业微信里沉淀的群聊、文档、会议、邮件、日程——也就是说,它真的”懂”你们公司每天在忙什么。
即梦AI Seedance 2.0 VIP:原生4K视频来了
即梦AI今天给Seedance 2.0 VIP版本上了原生4K功能。注意是”原生”,不是把1080P放大到4K那种套路,而是直接以4K分辨率渲染。
这意味着画面细节、色彩层次、光影精度都有质的提升。对于影视后期、品牌广告这些专业场景来说,AI视频工具的可用性又上了一个台阶。
豆包2.1专业版发布:能操控你电脑的AI员工
豆包2.1专业版今天也来了。接入Pro模型后,它的能力从”聊天”升级到了”干活”——可以操作你的本地电脑、使用浏览器、执行定时任务。
定价分三档,还有教育优惠。字节这是在推”AI数字员工”的概念了。
特斯拉车机接入豆包:语音助手变聪明了
最后一条——特斯拉中国宣布车机系统将通过OTA升级接入豆包大模型。语音助手会采用”分工协作”模式:豆包负责硬件控制指令,DeepSeek处理复杂对话。
以后对着特斯拉说”我有点冷”,它可能真的懂你什么意思。
今天这几条里,你最关注哪个?评论区聊聊。
本文地址:https://www.163264.com/13349


微信扫一扫,鼓励一下~