苹果也开始学 Meta,完全开源了 OpenELM 一系列模型,包括270M、450M、1.1B和3B四个规模的模型

苹果也开始学 Meta,完全开源了 OpenELM 一系列模型,包括270M、450M、1.1B和3B四个规模的模型

苹果公司在人工智能领域迈出了重要的一步,通过开源OpenELM系列模型,展示了其对开放科学和共享资源的承诺。以下是对苹果这一举措的优化文案:

苹果也开始学 Meta,完全开源了 OpenELM 一系列模型,包括270M、450M、1.1B和3B四个规模的模型

**苹果公司推动AI开放创新,开源OpenELM系列模型**

苹果公司最近宣布了一个重大的人工智能开源项目——OpenELM,这一系列模型包括了从270M到3B不等规模的多个模型。这一举措不仅为AI研究和开发社区带来了前所未有的资源,也体现了苹果在推动技术创新和知识共享方面的领导力。

### **OpenELM系列模型亮点:**

– **全面开源:** 包括模型权重、推理代码以及完整的训练和评估框架。
– **数据集训练:** 提供了在公开数据集上进行模型训练的详细日志和多个保存点。
– **预训练设置:** 允许研究人员和开发者快速开始实验和定制。

### **CoreNet深度学习库:**

– **多样化模型支持:** 适用于从小型到大型的各种标准和创新模型。
– **多任务适用性:** 支持基础模型(如CLIP)、物体分类、检测和语义分割等多种任务。

### **OpenELM技术优势:**

– **参数分配策略:** 采用按层分配参数的方法,优化了Transformer模型的参数配置。
– **性能提升:** 在十亿参数规模下,OpenELM的准确率比OLMo提升了2.36%。
– **训练效率:** 预训练所需的Token数量减少了一半,显著提高了训练效率。

苹果公司的这一开源项目,不仅为AI社区提供了强大的工具,也为研究人员和工程师提供了一个平台,以促进创新和加速AI技术的发展。OpenELM系列模型和CoreNet深度学习库的开源,预示着一个更加开放和协作的AI研究时代的到来。

项目地址:

https://github.com/apple/corenet

模型下载:

https://huggingface.co/apple/OpenELM

论文地址:

https://arxiv.org/pdf/2404.14619.pdf

本文地址:https://www.163264.com/7002

(1)
上一篇 2024年4月24日 下午11:59
下一篇 2024年4月25日 上午1:13