模型框架

  • Meta的Llama 3.1正式发布,包含8B、70B、405B 三个型号

    Meta 致力于开放可访问的 AI,发布了 Llama 3.1 405B 等一系列模型,并在模型架构、训练优化、功能改进、安全措施、开放生态等方面取得了重要进展。 重要亮点

    2024年7月24日
  • Hugging Face 推出“”小语言 Python 编程模型

    Hugging Face 公布了“SmolLM”小语言模型家族,其中包含 1.35 亿、3.6 亿及 17 亿参数模型 地址: https://huggingface.co/blog/smollm

    2024年7月21日
  • GPT-3.5退役,GPT-4o mini来了,成本骤降

    OpenAI突发新模型,全面取代老去的GPT-3.5。 GPT-4o mini,能力接近原版GPT-4,价格却要便宜一个数量级: 对应的API也已经开放,支持128k输入tokens(图像和文本),更令人瞩目的是支持16k输出tokens。 相比之下,隔壁Claude3.5Sonnet几天前刚刚升级8k输出tokens。 以其低成本和低延迟特性,官方推荐用于多种场景: 原文:h…

    2024年7月19日
  • 阿里通义音频生成大模型 FunAudioLLM

    该项目包括两个核心模型: SenseVoice和CosyVoice,分别致力于语音生成和语音识别。FunAudioLLM支持多种人机交互应用场景,如多语言翻译、情绪语音对话、互动播客和有声读物等。 地址: https://fun-audio-llm.github.io 在线体验地址: https://www.modelscope.cn/studios/iic/CosyVoice…

    2024年7月9日
  • Meta 发布名为 Meta 3D Gen(3DGen)的全新 AI 模型:1 分钟内生成高质量 3D 内容

    第一阶段 根据用户提供的文本提示,第一阶段使用 Meta 的三维资产生成模型(AssetGen)创建初始 3D 资产。该步骤生成一个带有纹理和 PBR 材质贴图的 3D mesh。推理时间约为 30 秒。 第二阶段 根据阶段 1 生成的三维资产和初始文本提示,阶段 2 将为该资产生成更高质量的纹理和 PBR 贴图。它使用 Meta 的文本到纹理生成器 Meta 3D Textu…

    2024年7月3日
  • 完美支持中英日语言的开源TTS模型来了:Fish Speech

    Fish Speech是一个开源的TTS模型,支持中英日语言,语音处理接近人类水平。模型使用约十五万小时的三语数据训练,对中文支持非常完美。 项目地址: https://github.com/fishaudio/fish-speech 体验地址: https://fish.audio/zh-CN/text-to-speech 这是邓紫棋的声音:

    2024年7月3日
  • Google 开源了 Gemma 2 的 9B 和 27B 版本,同时Gemini 1.5 Pro 上 200 万 Token 上下文向所有开发者开放

    Google 开源了 Gemma 2 的 9B 和 27B 版本,同时Gemini 1.5 Pro 上 200 万 Token 上下文向所有开发者开放Google 开源了 Gemma 2 的 9B 和 27B 版本,同时Gemini 1.5 Pro 上 200 万 Token 上下文向所有开发者开放Google 开源了 Gemma 2 的 9B 和 27B 版本,同时Gemini 1.5 Pro 上 200 万 Token 上下文向所有开发者开放Google 开源了 Gemma 2 的 9B 和 27B 版本,同时Gemini 1.5 Pro 上 200 万 Token 上下文向所有开发者开放

    Gemma 2是一款高性能的AI模型,具有出色的推断效率和成本效益。通过优化的架构设计,Gemma 2在27B参数规模下表现出色,提供了与两倍大小的模型竞争力相当的性能。而9B参数规模的Gemma 2模型在其类别中也表现卓越,超越了其他同规模的开源模型。 Gemma 2的推断效率和成本节约优势显著,27B模型设计能够在单个Google Cloud TPU主机、NVIDIA A1…

    2024年6月28日 开源项目
  • 图片高清修复模型AuraSR开源,可放大4倍并补充细节

    AuraSR 是基于 GAN 的 Super-Resolution 模型,通过图像条件化增强技术,提升生成图像的质量。该模型采用 GigaGAN 论文的变体实现,并使用 Torch 框架。AuraSR 的优势在于能够有效提高图像的分辨率和质量,适用于图像处理领域。 这里可以在线体验: https://fal.ai/models/fal-ai/aura-sr/playground…

    2024年6月27日
  • 科大讯飞正式推出了全新的讯飞星火大模型V4.0

    科大讯飞正式推出了全新的讯飞星火大模型V4.0科大讯飞正式推出了全新的讯飞星火大模型V4.0科大讯飞正式推出了全新的讯飞星火大模型V4.0科大讯飞正式推出了全新的讯飞星火大模型V4.0

    七大核心能力全新升级,全面对标GPT-4 Turbo 多模理解 上传图片素材,大模型完成识别理解,返回关于图片的准确描述 视觉问答 围绕上传图片素材,响应用户的问题,大模型完成回答 多模生成 根据用户的描述,生成符合期望的合成音频和视频 虚拟人视频 描述期望的视频内容,整合AI虚拟人,快速生成匹配视频 代码生成 智能生成单行或函数级代码建议;根据注释、函数名自动生成代码 代码解…

    2024年6月27日 模型框架
  • 斯坦福大模型评测榜 Claude 3 排名第一

    尽管Massive Multitask Language Understanding(MMLU)基准测试备受关注,但模型创建者报告的MMLU分数经常以不一致或有问题的方式产生,这阻碍了它们的可比性。为了解决这个问题,我们引入了HELM MMLU,一个排行榜,展示了评估各种语言模型在MMLU上的结果。我们的评估结果包括简单和标准化的提示,每个57个主题的准确性分解,以及所有原始提…

    2024年6月24日