• DeepL进军实时语音翻译:96%语言学家更青睐,打破口语交流语言壁垒

    4月16日,以文字翻译闻名的德国AI公司DeepL正式宣布推出实时语音翻译产品套件DeepL Voice-to-Voice,标志着这家翻译领域的”隐形冠军”正式进军口语交流市场。 核心看点 专为实时口语交流设计,支持语音通话实时翻译 盲测中96%的语言学家更青睐DeepL Voice,胜过谷歌、微软、Zoom原生方案 套件包含会议翻译、跨平台对话、跨语言…

    ai-tool 25分钟前
  • 腾讯混元3D世界模型2.0开源发布:AI从”捏物体”进化到”造世界”,无缝对接游戏引擎

    4月16日,腾讯正式宣布混元3D世界模型2.0(HY-World 2.0)发布并全面开源。这款多模态世界模型标志着AI能力的一次重大跃迁——从”对话”、”画图”、”捏物体”,正式进化到了”造世界”。 核心看点 支持文字、图片、视频多模态输入,一键生成可漫游的完整3D世界 直接输出可编…

    llm 25分钟前
  • Anthropic发布Claude Opus 4.7:高阶编程能力再进化,复杂编码任务无需人工紧盯

    4月16日,AI巨头Anthropic正式推出Claude Opus 4.7,这是其旗舰大语言模型的又一次重大升级。距离上次更新仅两个月,Anthropic正保持着稳定的两月一更节奏,持续向开发者社区输出更强悍的编程助手。 核心看点 超高难度编码任务所需人工监督大幅减少,可放心托付最复杂的工程挑战 视觉能力大幅增强,支持更高分辨率图像识别,界面设计审美显著提升 多会话记忆能力升…

    llm 25分钟前
  • OpenAI Codex 重大更新:从写代码工具变成能操作电脑的 AI 助手

    OpenAI 给 Codex 推了一次重大升级,把这个每周被 300 多万开发者使用的编程助手,从写代码的扩展成了能操作整台电脑的工作伙伴。 核心升级:电脑操作能力 Codex 现在能自己看屏幕、自己点鼠标、自己敲键盘,在 Mac 上跑多个 agent 并行干活,而且不会抢占你正在用的其他窗口。这对于那些没开放 API 的软件特别有用——以前 agent 碰到这类应用就歇菜,现…

    应用 35分钟前
  • 超20万台AI服务器暴露攻击风险:Anthropic MCP被曝严重设计缺陷

    一份安全报告揭示了Anthropic的MCP协议存在严重设计缺陷,可能让超过20万台AI服务器面临远程代码执行的风险。该漏洞源于MCP SDK的STDIO接口,允许运行任何传入的操作系统命令,且无校验和警告。 漏洞详情 🧠 MCP架构设计缺陷 Model Context Protocol (MCP) 是Anthropic推出的用于连接AI模型与外部系统的协议。然而,研究发现其架…

    行业/好文 2小时前
  • 蚂蚁灵波科技开源 LingBot-Map:单摄像头实现实时流式三维重建

    蚂蚁灵波科技近日开源了流式三维重建模型 LingBot-Map,该模型仅需单个普通 RGB 摄像头即可在视频采集过程中实时估计相机位姿并重建场景三维结构,为机器人导航、自动驾驶及 AR 硬件等提供了高效、稳定且连续的在线建图能力。 核心特性 📱 单摄像头实时重建 LingBot-Map 支持单个普通 RGB 摄像头实时估计相机位姿并重建场景三维结构,无需昂贵的激光雷达或多摄像头…

    开源项目 2小时前
  • 谷歌发布最强TTS模型Gemini-TTS:支持近70种语言,提示词即可调控情感风格

    谷歌正式推出 Gemini-TTS 模型,在文本转语音(TTS)领域实现了重大突破。该模型可通过提示词直接调控语音的情感、节奏和风格,使合成语音更加自然细腻。 核心亮点 ✨ 提示词精确控制 Gemini-TTS 支持通过提示词精确控制语音的情感、节奏和风格。用户无需复杂的参数设置,只需用文字描述想要的语调、情感或风格,模型就能生成符合要求的语音输出。 🌍 近70种语言支持 该模…

    应用 2小时前
  • 腾讯开源混元3D世界模型2.0:一键生成可编辑3D空间资产

    腾讯混元团队正式发布并开源了「混元3D世界模型2.0」(HY-World 2.0),该版本在多模态世界模型上实现了重大升级,标志着 AI 从生成视频向生成可交互、可编辑3D资产的跨越。 核心突破 🧠 从视频到可交互3D资产 HY-World 2.0 实现了从生成视频到生成可交互、可编辑3D资产的质变。用户不仅可以获得静态3D模型,还能得到可在游戏引擎中直接使用的动态、可交互空间…

    模型框架 2小时前
  • 阿里巴巴 ATH 推出开放世界模型 Happy Oyster,开启实时交互新体验

    阿里巴巴 ATH 团队近日推出全新开放世界模型 Happy Oyster,该模型具备实时交互和创建能力,进一步拓展了其在生成式 AI 领域的技术布局。 核心亮点 🧠 Happy Oyster:开放世界实时交互 Happy Oyster 是阿里巴巴 ATH 团队最新推出的开放世界模型,支持实时交互与创建能力。这标志着生成式 AI 技术正从静态内容生成向动态可交互环境进化,为用户带…

    开源项目 2小时前
  • Anthropic 发布 Claude Opus 4.7:软件工程能力大幅提升,视觉理解翻倍

    Anthropic 今日宣布 Claude Opus 4.7 正式发布并全面可用。作为 Opus 4.6 的直接升级版本,Opus 4.7 在高级软件工程能力方面实现了显著提升,尤其在处理最困难的任务时表现更加出色。 核心升级亮点 1. 软件工程能力跃升 Opus 4.7 让用户能够将最困难的编码工作放心地交给它处理——这类工作以前需要密切监督。该模型能够以严谨和一致性处理复杂…

    2小时前
点击查看更多