红杉:新的语言模型技术栈全解(这些数据值得一看)

红杉:新的语言模型技术栈全解(这些数据值得一看)

红杉美国发表了一篇新文章《The New Language Model Stack》。这篇文章分析了投资 Portfolio 里的 33 家小到种子轮,大到已经上市的公司,并总结出了八个关键点。每个点都结合了当前的最新趋势,并给出了对未来的预测。不仅值得一读,而且可以帮助读者更好地了解这个领域的最新进展。

原文地址:

https://www.sequoiacap.com/article/llm-stack-perspective/

红杉:新的语言模型技术栈全解(这些数据值得一看)

65% 的公司已经将应用投入生产,94% 的公司正在使用基础模型 API,88% 的公司认为检索技术,38% 的公司对像 LangChain 这样的 LLM 编排和应用开发框架感兴趣,不到 10% 的公司正在寻找用于监控 LLM 输出、成本或性能并进行 A/B 测试提示的工具,少数公司正在研究补充性的生成技术,15% 的公司从头开始或使用开源资源构建了自定义的语言模型。

红杉:新的语言模型技术栈全解(这些数据值得一看)

LLM API方面涉及的工具包括OpenAI, ANTHROPC, 以及Cohere等;向量数据库(Vector DBs)方面包括AWS, pgvector, 以及Pinecone等;开发框架方面包括LangChain, Llamalndex, 以及ANArCHY等;文本到语音(Text-to-speech)技术方面有Resemble.AI, ElevenLabs, 以及Wellsaid等;监控方面则包括Distyl, Guardrails, 以及Helicone等。

红杉:新的语言模型技术栈全解(这些数据值得一看)

在自定义模型训练/调整技术栈中,有许多有用的工具。这些工具可以帮助你计算、管理模型、开发框架、进行实验、监控、以及托管模型。其中,计算方面的工具包括aws、Google Cloud和Lambda等。模型中心方面则有Azure和Feplicate等。开发框架方面则包括Hugging Face、TensorFlow等。实验方面则有Weights & Biases、GANTRY和FOUNDARY等。监控/可观察性方面包括Feplicate、Arthur和arize等。最后,托管方面则包括WHYLABS和Mosaic”Modal等。

AI总结篇:

1. 几乎所有 Sequoia 网络中的公司都在将语言模型应用于其产品中,如代码、数据科学、聊天机器人、销售、法律、会计、搜索、消费支付和旅游规划等领域。

2. 新的语言模型 API、检索和编排构成了这些应用程序的新堆栈,开源使用也在增长。94%的公司正在使用基础模型 API,OpenAI 的 GPT 是样本中明显的首选,但 Anthropic 的兴趣在过去的季度中有所增长。88%的公司认为,检索机制(如向量数据库)将仍然是其堆栈的关键部分。

3. 公司希望将语言模型定制为其独特的上下文。目前,有三种主要的方式来自定义语言模型:从头开始训练自定义模型、对基础模型进行微调和使用预训练模型并检索相关上下文。

4. 今天,LLM API 的堆栈与自定义模型训练堆栈感觉上是分开的,但随着时间的推移,这些堆栈将越来越融合。

5. 语言模型 API 正变得越来越适合开发人员使用,这将导致更多的面向开发人员的工具。

6. 语言模型需要变得更加可信(输出质量、数据隐私、安全性)才能得到全面采用。

7. 语言模型应用将变得越来越多模态化,多种生成模型将被结合使用。

8. AI 正开始渗透到技术的每一个角落,只有 65% 的受访者正在生产中,许多应用程序相对简单。基础架构层将在未来几年内继续快速发展。

来源:https://mp.weixin.qq.com/s/ifIhUQO39lIUyUzaJx3Hfg

本文地址:https://www.163264.com/4288

(0)
上一篇 2023年6月17日 下午4:02
下一篇 2023年6月17日 下午4:53

相关推荐