漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-04 talkingdev

LLM自我奖励修正机制在数学推理中的突破性研究

近日,一项关于LLM(大语言模型)自我奖励推理的研究引起了广泛关注。该研究提出了一种创新的两阶段训练框架,使模型能够独立生成推理步骤、自我评估正确性,并在无需外部反馈的情况下迭代优化输出。这一框架结合了...

Read More
2025-03-04 talkingdev

FlexPrefill推出动态稀疏注意力机制,提升LLM长序列处理效率

近日,FlexPrefill技术通过动态调整稀疏注意力模式和计算预算,显著提升了大型语言模型(LLM)的推理效率。该技术通过查询感知模式确定和累积注意力索引选择,优化了长序列处理的速度和准确性。FlexPrefill的核心在...

Read More
2025-03-03 talkingdev

基于LLMs构建的餐厅与厨师知识图谱亮相

近日,一项基于LLMs(大型语言模型)构建的餐厅与厨师知识图谱项目在技术社区中引起了广泛关注。该项目通过利用LLMs的强大自然语言处理能力,成功地将全球范围内的餐厅与厨师信息整合到一个统一的知识图谱中。这一知...

Read More
2025-02-28 talkingdev

GPT 4.5被指缺乏实质性突破,业界质疑其创新价值

近日,关于GPT 4.5的讨论在技术圈内引发热议。尽管OpenAI尚未正式发布GPT 4.5,但已有不少声音质疑其是否真的带来了实质性的技术突破。一些专家认为,GPT 4.5可能只是在GPT 4的基础上进行了微调,缺乏革命性的创新。...

Read More
2025-02-28 talkingdev

AI技术重塑企业命运:部分公司面临淘汰,另一些则蓬勃发展

随着AI技术的快速发展,企业界正经历一场深刻的变革。一些公司因未能及时适应AI技术的应用而面临淘汰,而另一些公司则通过积极拥抱AI技术实现了业务的快速增长。数据显示,AI技术在提高生产效率、优化资源配置和提升...

Read More
2025-02-28 talkingdev

CoT-UQ框架:为大型语言模型引入链式思维不确定性量化

近日,GitHub上发布了一个名为CoT-UQ的创新框架,该框架旨在为大型语言模型(LLM)提供响应层面的不确定性量化。CoT-UQ通过集成链式思维(Chain-of-Thought, CoT)推理,能够更精确地评估模型在生成响应时的置信度。...

Read More
2025-02-27 talkingdev

SubPOP发布大规模数据集,助力LLM精准预测公众调查结果

近日,SubPOP发布了一个大规模数据集,专门用于微调LLM(大语言模型),以预测调查响应分布。该数据集通过减少预测差距,显著提升了模型在未见过的调查数据上的泛化能力。这一技术突破为公众意见预测提供了更精准的...

Read More
2025-02-27 talkingdev

LLM推理能力研究:System 2思维在大型语言模型中的应用

近期,一项针对OpenAI的o1/o3和DeepSeek的R1等推理型LLM的研究揭示了这些模型在逐步逻辑推理能力方面的表现。研究通过对比人类认知能力,对这些模型进行了基准测试。结果显示,尽管LLM在复杂任务中表现出色,但在需...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page