LLM

  • 网易有道云笔记发布LLM Wiki套件:AI时代的”第二大脑”来了

    网易有道云笔记推出了「LLM Wiki」技能套件,这可不是一次简单的小更新,而是知识管理方式的根本性变革。 核心看点 传统笔记软件的痛点是什么?你记了一堆东西,但找起来费劲,关联不起来。LLM Wiki 要解决的就是这个问题——它通过大语言模型对碎片化知识进行深度关联和加工,把你的笔记变成一本主动为你服务的智能百科。 最大变化是:从”你主动去搜”变成&#…

    应用 2026年4月27日
  • OpenAI发布GPT-5.5:运算速度飙升,Token成本大幅下降

    4月24日,OpenAI正式发布新一代大语言模型GPT-5.5。公司称其为”迄今为止智能程度最高、使用体验最为直观的版本”。 核心看点 相比GPT-5.4,运算速度更快、逻辑更精准,且Token消耗显著减少 适用场景广泛:从智能体编程、知识处理等企业级应用,到数学运算、科学研究等前沿领域 在操控电脑完成办公任务方面能力优于前代,科研和技术研究流程实现明显…

    模型框架 2026年4月25日
  • 寒武纪Day 0适配DeepSeek-V4:国产AI芯片的又一次突破

    4月24日,寒武纪宣布已完成对DeepSeek-V4的Day 0适配——模型发布当日即可稳定运行,适配代码已开源至GitHub。 核心看点 基于vLLM推理框架,完成285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的即时适配 通过自研融合算子库Torch-MLU-Ops,对Compressor、mHC等新结构进行专项加速 利用BangC高性…

    模型框架 2026年4月25日
  • Microsoft MarkItDown —— 微软出的文档转 Markdown 工具

    一句话总结 把各种格式的文件(PDF、Word、PPT、Excel、图片、音频、YouTube 视频等)转换成 Markdown,方便喂给 LLM 做分析。 核心能力 格式 支持情况 PDF ✅ 文本提取 + 表格/列表结构保留 Word (docx) ✅ 标题、列表、表格、链接 PowerPoint (pptx) ✅ 幻灯片内容转结构化 Markdown Excel (xls…

    开源项目 2026年4月9日
  • LangChain是什么?构建LLM应用的Python框架,AI开发者必备工具

    LangChain是最流行的LLM应用开发框架,提供模块化组件连接大模型与外部数据,让开发者快速构建ChatGPT类应用,GitHub星标超9万。

    2026年3月4日
  • LLM企业应用落地场景中的问题一览 |LLM |RAG |Agent |TorchV

    LLM企业应用落地场景中的问题一览 |LLM |RAG |Agent |TorchVLLM企业应用落地场景中的问题一览 |LLM |RAG |Agent |TorchVLLM企业应用落地场景中的问题一览 |LLM |RAG |Agent |TorchVLLM企业应用落地场景中的问题一览 |LLM |RAG |Agent |TorchV

    最近两个多月写文章的频率明显低了很多,不是因为懒了,而是忙着做LLM应用的客户场景落地去了。今天把客户场景落地中的一些心得总结分享一下,希望对广大期望LLM应用落地的企业有一些帮助。 前述 与很多企业客户的深度接触之后,发现绝大多数企业在LLM应用落地中存在三个显著问题,这些企业包括世界500强企业、央企、著名品牌公司,也包括和我们一样但非AI行业的创业公司,所以从样本上来说应…

    2024年5月27日 教程
  • 开源大语言模型完整列表:国内外公司、科研机构等组织开源的 LLM 进行了全面的整理

    Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。 所谓”语言模型”,就是只用来处理语言文字(或者符号体系)的 AI 模型,发现其中的规律,可以根据提示 (prompt),自动生成符合这些规律的内容。 LLM 通常基于神经网络模型,使…

    2023年10月14日
  • a16z:大语言模型(LLM)的新兴架构

    a16z:大语言模型(LLM)的新兴架构a16z:大语言模型(LLM)的新兴架构a16z:大语言模型(LLM)的新兴架构a16z:大语言模型(LLM)的新兴架构

    – 大型语言模型是构建软件的强大新原语。 – LLM 应用程序堆栈是新兴的参考架构,展示了人工智能初创公司和尖端科技公司使用的常见系统、工具和设计模式。 – 堆栈还处于早期阶段,可能会随着底层技术的进步而变化。 – 该工作基于与人工智能初创公司创始人和工程师的对话。 – 设计模式:情境学习是一种常见的方法,使用现成的法…

    2023年7月14日 行业/好文
  • Chatbot Arena:大型语言模型 (LLM) 评级平台(附最新排行榜)

    Chatbot Arena:大型语言模型 (LLM) 评级平台(附最新排行榜)Chatbot Arena:大型语言模型 (LLM) 评级平台(附最新排行榜)Chatbot Arena:大型语言模型 (LLM) 评级平台(附最新排行榜)Chatbot Arena:大型语言模型 (LLM) 评级平台(附最新排行榜)

    Chatbot Arena:主要针对主流几个开源模型进行测评(目前很多模型还没纳入进来) 网址:https://chat.lmsys.org/ 测评系统:随你给你模型两两比对进行打分。 PS:Elo 评分系统统是指由匈牙利裔美国物理学家 Arpad Elo 创建的一个衡量各类对弈活动水平的评价方法,是当今对弈水平评估的公认的权威方法。被广泛用于国际象棋、围棋、足球、篮球、电子竞…

    2023年5月26日 行业/好文