arXiv的相关内容 - 漫话开发者

2026-05-06 talkingdev

论文推荐|Google重新定义AI幻觉：从“知识缺陷”转向“不确定性表达”

谷歌最新研究为人工智能领域的“幻觉”问题提供了一个颠覆性的理论框架。该论文指出，大语言模型（LLM）产生幻觉的核心并非传统认知中的“知识缺陷”或信息错误，而是模型在输出时未能有效表达其内在的不确定性。研究提...

2026-05-01 talkingdev

智谱AI团队发布的最新研究成果GLM-5V-Turbo，在人工智能领域迈出了关键一步。该模型的核心创新在于将多模态感知能力直接内嵌到模型的推理过程和工具使用中，而非作为独立的预处理步骤。这意味着模型能够同时处理并理...

2026-04-27 talkingdev

来自arxiv的最新研究提出了一种名为Vision Banana的通用视觉模型，该模型的核心创新在于将传统的视觉感知任务重新表述为图像生成问题。通过指令微调（instruction-tuning）的图像生成模型，Vision Banana能够在多种...

2026-04-25 talkingdev

一篇发表于arXiv上的新论文《There Will Be a Scientific Theory of Deep Learning》正引发人工智能学术界的广泛讨论。该文阐述了深度学习虽在实践中取得空前成功，但其理论基础仍相对薄弱，核心机制尚未被完全揭示...

2026-04-14 talkingdev

DeepMind的研究团队近日在arXiv上发布了一项名为“弹性循环Transformer”的创新工作，为视觉生成模型领域带来了显著的效率突破。传统视觉生成模型通常依赖堆叠大量独立的Transformer层，导致参数量庞大。ELT的核心创新...

2026-04-06 talkingdev

一项名为‘简单自蒸馏’（Simple Self-Distillation, SSD）的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于，仅利用模型自身在特定采样配置（如温度参数和截断策略）下生成...

2026-02-04 talkingdev

近日，一项名为SWE-Universe的研究提出了一种革命性的可扩展框架，旨在从GitHub的拉取请求中自动构建真实世界的软件工程可验证环境。该研究成功解决了自动化构建中长期存在的三大挑战：构建成功率低、验证机制薄弱以...

2026-02-03 talkingdev

近日，NVIDIA研究团队提出了一种名为“金鹅”（Golden Goose）的创新方法，旨在解决大语言模型（LLM）强化学习领域的一个关键瓶颈。当前，基于可验证奖励的强化学习（RLVR）是解锁LLM复杂推理能力的重要基石，但其发展...