新加坡科技设计大学(SUTD)团队发表论文,提出11亿参数的小型语言模型TinyLlama,其在大约1万亿个Token上进行了3轮预训练。
论文地址:
https://arxiv.org/pdf/2401.02385.pdf
本文地址:https://www.163264.com/5996
新加坡科技设计大学(SUTD)团队发表论文,提出11亿参数的小型语言模型TinyLlama,其在大约1万亿个Token上进行了3轮预训练。
论文地址:
https://arxiv.org/pdf/2401.02385.pdf
本文地址:https://www.163264.com/5996