自回归模型的相关内容 - 漫话开发者

2026-04-30 talkingdev

Latent Diffusion突破文本推理瓶颈：苹果LaDiR框架让LLM思考更缜密

苹果机器学习研究团队提出了一种名为LaDiR（Latent Diffusion Reasoner）的创新推理框架，为大型语言模型（LLM）的文本推理能力带来了显著提升。LaDiR框架的核心在于巧妙地将连续潜在表示的强大表现力与潜在扩散模型...

2026-02-25 talkingdev

人工智能初创公司Inception Labs近日正式发布了其新一代大语言模型Mercury 2，并宣称该模型是“全球最快的推理语言模型”。其核心目标是让生产环境中的AI应用响应达到“瞬时”体验。Mercury 2的技术亮点在于其采用了创新...

2026-01-26 talkingdev

字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目，这是一个基于扩散模型（Diffusion Model）构建的轻量级代码大语言模型（Code DLLM）家族。该项目创新性地将扩散模型的生成范式引入代码建模领域，通过“块扩...

2025-12-02 talkingdev

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型，标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型，其核心在于巧妙地将自回归模型强大的表达能力与归...

2025-11-05 talkingdev

当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型，但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升，更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本，在创造...

2025-10-21 talkingdev

近日，谷歌DeepMind团队发布的Gemini Diffusion实验性语言模型引发学界关注。该模型突破传统GPT逐词生成范式，采用扩散模型技术通过逐步去噪的方式直接生成完整文本块。研究人员在研读《大语言扩散模型》论文时发现...

2025-05-14 talkingdev

近期GitHub开源项目EAR提出了一种突破性的视觉自回归生成方法，通过采用严格适当评分规则（如能量评分）绕过了传统量化步骤，直接在连续数据空间中进行生成。该技术摒弃了传统概率建模的约束，通过数学上严谨的评分...

2025-04-29 talkingdev

Valeo AI最新发布了两项突破性技术：VaViM自回归视频模型和VaVAM驾驶轨迹预测模型。VaViM通过时空令牌序列预测技术，实现了对连续视频帧的高精度建模；而VaVAM则创新性地将学习到的视频表征通过模仿学习转化为可执行...