出门问问昨日在其微信公众号宣布,将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集,命名为“序列猴子开源数据集1.0”。本次开源的“序列猴子数据集1.0”包含了中文通用文本语料、古诗今译语料以及文本生成语料,这些数据资源经过精心挑选和整理,确保了数据质量和数据格式。同时,出门问问采用宽松的许可协议,为广大开发者和研究人员提供了便捷的使用条件。
序列猴子是出门问问提供的超大规模语言模型,基于其通用的表示与推理能力,支持多轮交互,能够大幅度提高生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。
序列猴子数据集是用于训练序列猴子模型的数据集合,现选择部分数据集向公众开放。
序列猴子开源数据集1.0为序列猴子数据集的首个开源版本,涉及以下领域(请点击链接以查看详情):
本文地址:https://www.163264.com/6656