苹果发布AI推理框架LaDiR:突破单一思维,让AI同时探索多条解题路径

核心看点

  • 并行推理机制:LaDiR让AI在回答问题前同时启动多条独立的推理路径,从随机噪声开始逐步优化,最后选出最佳答案
  • 扩散+自回归混合架构:推理阶段使用扩散模型并行探索,最终输出阶段使用自回归模型保证连贯性
  • 多样性鼓励机制:框架内置特殊机制防止所有路径过早收敛于同一结论,确保每条路径探索不同解题思路
  • 实测表现优异:在LLaMA 3.1 8B和Qwen3-8B-Base上部署测试,数学推理和代码生成准确率显著提升

AI推理的方式正在被重新定义。

苹果公司携手加州大学圣迭戈分校团队发布了新论文《LaDiR:潜在扩散增强LLM文本推理》,提出了一个名为LaDiR的创新框架。这个框架不是训练新模型,而是叠加在现有模型之上的通用推理优化方案,核心思路是改变模型”思考问题的方式”。

目前的语言模型在推理时通常是”线性走到底”——沿着一条推理路径一步步推演,错了就重来,效率不高且容易陷入思维定式。LaDiR的解法很巧妙:它融合了扩散模型(Diffusion)和自回归模型(Autoregression)两种主流生成范式的优点。

在推理阶段,LaDiR采用扩散模型的方式,同时启动多条独立的推理路径。每条路径从随机噪声开始,通过逐步去噪的过程,最终优化成连贯的推理步骤。为了防止所有路径”偷懒”走到一起去,框架还设计了一个多样性鼓励机制,强制每条路径探索不同的解题思路,从而生成多样化的候选答案池。最后,再使用自回归模型将这些候选方案”缝合”成最终的连贯输出。

研究团队在Meta的LLaMA 3.1 8B和Qwen3-8B-Base上进行了部署测试。结果令人印象深刻:

  • 数学推理:在标准数学基准测试中,LaDiR取得了比现有方法更高的准确率,在面对更困难的分布外任务时表现尤为突出。
  • 代码生成:在HumanEval代码生成测试中,LaDiR生成的代码更加可靠,在难题上的表现明显优于标准微调方法。
  • 谜题规划:LaDiR能探索更广泛的解空间,找到正确解的概率高于所有通用基准模型。

不过,研究团队也坦诚地指出,在单次尝试准确率上,LaDiR仍略逊于专门针对特定任务优化的专用模型——这并不意外,通用框架在追求广泛适用性的同时,在极致专精领域确实还有提升空间。

总的来看,LaDiR为提升大语言模型的推理能力提供了一条新思路:不是把模型做得更大、参数更多,而是让模型”想得更多、更广”。对于复杂问题解决场景,这种并行探索+择优输出的模式,或许是大模型能力提升的又一条可行路径。

论文地址:LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning

本文地址:https://www.163264.com/11335

(0)
上一篇 10小时前
下一篇 4小时前

相关推荐