谷歌又来搞事情了!这次不是Gemini的更新,而是一款全新的开源模型——DiffusionGemma。
核心看点
6月11日,谷歌正式发布并开源了DiffusionGemma,这是一款基于文本扩散机制的大语言模型。与传统的GPT、Gemini等自回归模型不同,DiffusionGemma采用了一种全新的文本生成方式,在本地推理速度上实现了4倍的提升。
什么是文本扩散模型?
传统的大语言模型(如GPT)采用自回归方式,按照从左到右的顺序逐个生成Token。而DiffusionGemma借鉴了AI图像生成的方法——一次性生成整段文本雏形,然后通过多轮迭代进行打磨润色,直至内容可读。
这种方式的优势显而易见:
- 速度更快:并行生成文本块,推理速度提升最高4倍
- 内存更低:内存占用显著减少,可运行在高端消费级显卡上
- 开源开放:采用Apache 2.0许可证,面向开发者和研究人员
为什么这很重要?
自回归模型统治了大语言模型领域多年,但逐Token生成的方式存在天然的效率瓶颈。谷歌的DiffusionGemma证明,扩散模型不仅适用于图像生成,在文本领域同样大有可为。
对于端侧AI和本地部署来说,DiffusionGemma的出现是一个重大利好。它意味着未来我们有可能在普通消费级硬件上,运行更强大的本地AI模型。
总结
DiffusionGemma的发布,是谷歌在AI架构创新上的一次重要尝试。它打破了自回归模型的垄断地位,为文本生成开辟了全新的技术路线。如果扩散模型在文本领域被证明是成功的,整个AI行业的基础架构都可能随之改变。
本文地址:https://www.163264.com/12921


微信扫一扫,鼓励一下~