百灵大模型
-
蚂蚁集团百灵大模型开源 Ling-2.6-flash:104B参数、4卡H20跑到340 tokens/s
4月29日消息,蚂蚁集团旗下百灵大模型今日宣布 Ling-2.6-flash 正式开源,同步提供 BF16、FP8、INT4 等多个量化版本,方便开发者根据硬件环境和部署需求灵活选择。 核心看点 惊人推理速度:4卡H20环境下推理速度最快可达 340 tokens/s 超高效 Token 消耗:完整评测仅消耗 1500 万 tokens,约为竞品的 1/10 104B 总参 +…