推理的相关内容 - 漫话开发者

2025-07-15 talkingdev

[论文推荐]基于能量的Transformer模型：可扩展的学习与思考者

一项名为'基于能量的Transformer'（Energy-Based Transformers）的新型架构在机器学习领域取得突破性进展。该技术摒弃了传统的直接预测方式，转而采用学习验证函数来评估输入与候选输出之间的兼容性得分。这种创新架...

2025-07-14 talkingdev

近期，一篇关于强化学习（RL）如何扩展至惊人10^26 FLOPs（每秒浮点运算次数）的探讨引起了业界广泛关注。文章指出，强化学习被视为构建前沿AI模型，尤其是大型语言模型（LLMs）的下一个核心训练技术。传统观点认为...

2025-07-14 talkingdev

当前机器人控制策略的部署，通常面临着预测与执行之间的同步瓶颈，这可能导致系统响应迟滞和效率低下。Hugging Face博客最新分享的“异步推理”（Asynchronous Inference）技术，为解决这一难题提供了创新方案。该技术...

2025-07-11 talkingdev

开发者Henry和Roman近日推出开源项目Cactus，这是一个专为智能手机设计的跨平台框架，支持本地部署大型语言模型（LLM）、视觉语言模型（VLM）和文本转语音（TTS）模型。与Ollama专注于笔记本和边缘服务器不同，Cactu...

2025-07-10 talkingdev

最新研究发现，在数学问题中插入诸如'有趣的事实：猫一生大部分时间在睡觉'等无关短语，会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性，且蒸馏版模型表现...

2025-07-10 talkingdev

斯坦福大学SNAP实验室在GitHub开源了Biomni项目，这是一种通用型生物医学AI智能体，通过结合大语言模型（LLM）的推理能力、检索增强规划技术以及代码执行功能，能够自主完成跨生物医学领域的研究任务。该系统突破了...

2025-07-10 talkingdev

Google最新发布的Gemma 3n和MatFormer模型采用了创新的嵌套Transformer架构，通过Mix-n-Match技术实现弹性推理功能。该技术允许模型在运行时动态调整计算资源分配，显著提升推理效率并降低计算成本。本实践教程详细...

2025-07-10 talkingdev

人工智能公司Perplexity近日发布了名为Comet的创新浏览器产品，该产品专为研究工作场景设计，深度整合了Perplexity自主研发的搜索与推理引擎技术。Comet浏览器通过AI能力重构了传统浏览器的交互范式，可同时支持工作...