海内外大语言模型（LLM） | 第16页

阿里 HappyHorse 模型横空出世：AI视频生成登顶全球第一

4月10日，阿里官方正式”认领”了此前在AI视频领域引发轰动的神秘模型HappyHorse。据悉，该模型由阿里ATH创新事业部独立研发，主打原生音视频一体化生成、多语言唇形同步等核心能力。根据第三方权威评测，HappyHorse已在文生视频和图生视频双赛道超越Seedance等头部竞品，跃居全球第一。核心能力解析原生音视频一体化：告别传统先生成视频…

模型框架 2026年4月10日

模型框架

消息称软银寻求 400 亿美元贷款投资 OpenAI，规模创纪录

今天分享一则来自IT之家的AI行业动态。 📰 模型框架消息称软银寻求 400 亿美元贷款投资 OpenAI，规模创纪录这是一篇关于AI领域的最新资讯，值得关注。 🔗 点击阅读原文本文由 AI 自动整理生成，内容仅供参考。来源: IT之家

2026年3月7日

应用

Inception Labs 开发的一款基于扩散技术的大型语言模型（dLLM）- Mercury Coder,这玩意儿太快了……

技术特点 Mercury Coder 是由 Inception Labs 开发的一款基于扩散技术的大型语言模型（dLLM），专为高效编程和文本生成设计。性能表现应用场景优势总结 Mercury Coder 的主要优势在于其极高的生成速度和并行处理能力，同时保持了与传统模型相当的性能。它还具备纠错能力，能够生成更准确的文本和代码。体验地址： https://chat.in…

2025年3月8日

开源项目

DeepSeek发布Janus-Pro多模态大模型，进军文生图领域

在一些基准测试中，Janus-Pro-7B 击败了 OpenAI 的 DALL-E 3 以及 Stable Diffusion、Emu3-Gen 等热门模型。Janus Pro 采用 MIT 开源协议，可无限制用于商业场景。并且该大模型是 2024 年 11 月 13 日发布的 JanusFlow 大模型的高级版本。（暂时只能处理384×384分辨率的图像）模型地址…

2025年1月28日

模型框架

Stability AI 推出 SPAR3D，能够在不到一秒的时间内从单个图像中生成精确的3D对象

Stability AI 在2025年1月9日的CES展会上宣布推出了一种名为SPAR3D（Stable Point Aware 3D）的创新3D生成技术。SPAR3D是一种两阶段的3D生成方法，能够在不到一秒的时间内从单个图像中生成精确的3D对象，并支持实时编辑功能。这项技术为游戏开发者、产品设计师和环境构建者提供了全新的3D原型设计方式。 SPAR3D的主要功能和特点技术…

2025年1月10日

开源项目

微软开源 140 亿参数小语言 AI 模型 Phi-4

微软于2025年1月8日在Hugging Face平台上开源了其小型语言模型Phi-4。Phi-4是微软2023年推出的小型语言模型系列的第四代产品，拥有140亿参数。该模型基于Transformer架构，采用仅解码器型架构，只关注单词之前的文本，减少了需要处理的数据量，从而降低了推理成本。 Phi-4在多个基准测试中表现优异，甚至超越了参数量更大的Llama 3.3 70B和…

2025年1月10日

模型框架

See3D 模型：能够利用无标注互联网视频进行3D 生成的模型

北京智源人工智能研究院推出的See3D模型是一项创新的技术，它能够利用无标注的互联网视频进行3D内容的生成。以下是See3D模型的一些关键特点： See3D模型的推出为3D生成领域带来了新的可能性，特别是在降低成本和提高效率方面，它为3D数据的采集和应用提供了一种新的解决方案。项目地址： https://vision.baai.ac.cn/see3d

2024年12月14日

开源项目

一个端到端的社会视觉-语言-动作建模框架

根据您的请求，以下是关于端到端的社会视觉-语言-动作建模框架SOLAMI的详细介绍： SOLAMI的推出标志着视觉-语言-动作模型在社会交互领域的新进展，为3D自主角色的社交智能提供了新的解决方案。项目地址： https://solami-ai.github.io

2024年12月14日

模型框架

智谱AI上线免费多模态模型GLM-4V-Flash

智谱AI最近推出了其首个免费的多模态模型——GLM-4V-Flash，这是一个重要的里程碑，标志着AI技术在多模态领域的进一步普及和应用。以下是GLM-4V-Flash的一些关键特点和功能：智谱AI的GLM-4V-Flash模型的上线，无疑为AI领域带来了新的可能性，特别是在图像理解和多模态交互方面。体验地址： https://www.bigmodel.cn/console…

2024年12月14日

模型框架

DeepSeek AI 发布新版 DeepSeek-V2.5-1210

DeepSeek AI 最近发布了其 DeepSeek V2 系列的最终版微调模型——DeepSeek-V2.5-1210。以下是该版本的主要特点和功能：这些更新使得 DeepSeek-V2.5-1210 成为一个在多个领域都具有强大性能的 AI 模型，为用户提供了更加全面和高效的服务。地址： https://huggingface.co/deepseek-ai/DeepS…

2024年12月14日