模型框架

  • 百川智能发布最新一代基座大模型 Baichuan 4

    据官方介绍,Baichuan 4 相较 Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过 10%,数学和代码能力分别提升 14% 和 9%,在国内权威大模型评测机构 SuperCLUE 的评测中,模型能力国内第一。 地址: https://platform.baichuan-ai.com/homePage 工具调用支持自定义工具调用,助力企业复杂场景支持对接…

    2024年5月22日
  • 中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一

    中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一

    机器之心发布 机器之心编辑部 上周,一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena,排名直接超过 GPT-4-Turbo、Gemini 1 .5 Pro、Claude 3 0pus、Llama-3-70b 等各家国际大厂的当家基座模型。随后 OpenAI 揭开 “im-also-a-good-gp…

    2024年5月21日 模型框架
  • AWPortrait 1.4 正式发布,人物肖像效果炸裂

      AWPortrait终于迎来了1.4,将SD1.5人像的真实感提升到了一个新的高度,增加了旗袍、汉服等东方元素,更好的棚拍效果及户外效果,可更改人物年龄,比较稳定的输出效果是10-80岁。 模型地址(1.99G): https://www.liblib.art/modelinfo/721fa2d298b262d7c08f0337ebfe58f8

    2024年5月3日
  • 苹果也开始学 Meta,完全开源了 OpenELM 一系列模型,包括270M、450M、1.1B和3B四个规模的模型

    苹果公司在人工智能领域迈出了重要的一步,通过开源OpenELM系列模型,展示了其对开放科学和共享资源的承诺。以下是对苹果这一举措的优化文案: **苹果公司推动AI开放创新,开源OpenELM系列模型** 苹果公司最近宣布了一个重大的人工智能开源项目——OpenELM,这一系列模型包括了从270M到3B不等规模的多个模型。这一举措不仅为AI研究和开发社区带来了前所未有的资源,也体…

    2024年4月25日
  • 中文聊天模型Llama3-8B-Chinese-Chat发布

    Llama3-8B-Chinese-Chat 是一个专为中文优化的聊天模型,基于 Meta-Llama-3-8B-Instruct 模型并通过 ORPO 进行微调。该模型显著减少了中文问题英文回答以及回答中中英文混合的现象,同时减少了回答中表情符号的使用,使得回答更加正式。 User: 我的蓝牙耳机坏了,我该去看牙科还是耳鼻喉科? Assistant: 很抱歉听到你的蓝牙耳机出…

    2024年4月23日
  • Meta 发布号称是最强大的开源大语言模型:Llama 3

    Meta 公司发布了新闻稿,宣布推出下一代大语言模型 Llama 3,共有 80 亿和 700 亿参数两种版本,号称是最强大的开源大语言模型。Llama 3 具有更强的推理能力和服从指令能力,并且能够处理文本、图片和视频。Meta 公司还发布了新的信任和安全工具,即将在 Facebook、Instagram、WhatsApp 等应用中整合 Llama 3。 地址: https:…

    2024年4月19日
  • MiniMax发布万亿MoE模型abab 6.5,包含abab 6.5和abab 6.5s两个模型

    国内 AI 初创企业 MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s两个模型。万亿MoE模型abab 6.5支持200k tokens的上下文长度,在各类核心能力测试中,开始接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等世界领先的大语言模型的性能。abab 6.5s跟abab 6.5使用了同样的训练技术和数据…

    2024年4月17日
  • 360 开源了 360 智脑 7B(70 亿参数模型)支持 50 万字长文本输入

    360 公司日前在 GitHub 上开源了 360 智脑 7B(70 亿参数模型)。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练,以中文、英文、代码为主,开放 4K、32K、360K 三种不同文本长度。360 表示,360K(约 50 万字)是当前国产开源模型文本长度最长的。 地址: https://github.com/Qihoo360/360zhinao

    2024年4月13日
  • 马斯克的xAI再次推出首个多模态模型 Grok-1.5 Vision 可将流程图转成 Python 代码

    1. **游戏概述**:– 这是一个猜数字游戏,其中计算机生成一个1到10之间的随机数,用户需要猜测这个数字。 2. **代码实现**:– 文章提供了一个Python函数`guess_number()`,该函数实现了游戏的核心逻辑。– 首先,使用`random.randint(1, 10)`生成一个1到10之间的随机整数作为目标数字(`tar…

    2024年4月13日
  • Ferret-UI:苹果开发出能“看懂”手机屏幕上并能执行任务的多模态模型

    根据提供的PDF文档内容,以下是对”Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs”论文的归纳总结: 1. **研究背景**:– 移动应用程序已成为日常生活中的重要组成部分,但现有的多模态大型语言模型(MLLMs)在理解和与用户界面(UI)屏幕有效交互方面存在不…

    2024年4月10日