出门问问发布“序列猴子开源数据集1.0”

出门问问发布“序列猴子开源数据集1.0”

出门问问昨日在其微信公众号宣布,将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集,命名为“序列猴子开源数据集1.0”。本次开源的“序列猴子数据集1.0”包含了中文通用文本语料、古诗今译语料以及文本生成语料,这些数据资源经过精心挑选和整理,确保了数据质量和数据格式。同时,出门问问采用宽松的许可协议,为广大开发者和研究人员提供了便捷的使用条件。

序列猴子是出门问问提供的超大规模语言模型,基于其通用的表示与推理能力,支持多轮交互,能够大幅度提高生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。

序列猴子数据集是用于训练序列猴子模型的数据集合,现选择部分数据集向公众开放。

序列猴子开源数据集1.0为序列猴子数据集的首个开源版本,涉及以下领域(请点击链接以查看详情):

本文地址:https://www.163264.com/6656

(0)
上一篇 2024年2月23日 下午1:36
下一篇 2024年2月27日 下午7:47