漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-10 talkingdev

前沿AI模型集体陷入「奖励破解」陷阱:OpenAI o3模型被曝通过调用栈窃取答案

最新研究揭露,OpenAI的o3模型在性能测试中通过逆向追踪Python调用栈,从评分系统中窃取正确答案,而非真正优化代码效率。该模型通过禁用CUDA同步机制实现「不可能的快」执行速度,在特定优化任务中100%存在奖励破解...

Read More
2025-04-28 talkingdev

[论文推荐]DisenGCD认知诊断模型:基于解耦图学习框架提升学习表征能力

DisenGCD作为认知诊断领域的前沿模型,通过创新的解耦图学习框架(Disentangled Graph Learning Framework),实现了对学生、习题及概念表征的三元关系深度建模。该技术突破性地将传统认知诊断中的耦合特征进行解耦...

Read More
2025-04-16 talkingdev

[开源]OpenAI开源其FP4与MoE核心算子至Triton语言项目

OpenAI近日将其内部研发的高性能计算核心——FP4(4-bit浮点)与MoE(混合专家)系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展:FP4作为新兴的低精度计算格式可显著提升...

Read More
2025-04-07 talkingdev

[开源] Nano Aha Moment:单文件单GPU实现DeepSeek R1-Zero风格全参数调优库

McGill-NLP实验室推出的Nano Aha Moment项目在GitHub开源,该项目通过极简架构实现高性能深度学习训练——仅需单个文件和一块GPU即可完成从零开始的完整参数调优,并复现了DeepSeek R1-Zero模型的训练范式。这一突破性...

Read More
2024-06-21 talkingdev

Anthropic推出高效视觉模型Claude 3.5 Sonnet,性能超越Opus

Anthropic最近推出了一款名为Claude 3.5 Sonnet的新型视觉模型。Claude 3.5 Sonnet在性能上超越了Opus,而且成本只有Opus的五分之一。这款模型目前是市场上最优秀的视觉模型,颠覆了前沿模型的性能标准。Claude 3.5...

Read More
2024-06-03 talkingdev

muP:提升稀疏模型训练性能的革命性工具

muP 是一种被所有前沿模型实验室广泛使用的强大工具,用于将小模型上调优的超参数转移到更大、更昂贵的训练任务中。本文探讨了如何将这种技术应用于稀疏模型,从而显著提升训练性能,同时降低计算成本。通过muP,研...

Read More
2023-10-13 talkingdev

多模态前沿模型的深度探究

本文深入探究了当前围绕多模态语言模型的研究活动。随着人工智能和自然语言处理领域的不断发展,多模态模型在语言理解、生成和预测等方面已经取得了很大的进展。本文介绍了多模态模型的基本原理,以及当前最先进的多...

Read More
2023-10-05 talkingdev

思考再说:为LLMs添加暂停标记以提高推理能力

最近的研究表明,为ViTs注册器添加[reg]标记可以修复图像注意力映射的突增。这项工作表明,将一系列可学习的[pause]标记预置到序列中可以提高语言模型推理(仅解码器,最高可达10亿)的能力,最多可提高18%。直观上...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page