漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-01 talkingdev

[论文推荐]研究人员发现通过表征控制向量可调节大语言模型推理能力

最新研究表明,通过在大语言模型(LLM)的残差流中实施简单的表征控制向量干预,可显著调节其推理性能。这项发表于arXiv的突破性研究揭示了神经网络内部表征与逻辑推理能力的直接关联,为可解释AI领域提供了新工具。...

Read More
2025-05-01 talkingdev

Promptrepo:无需编码,用Google Sheets即可微调AI模型

Promptrepo团队推出了一款创新工具,旨在让产品团队(而不仅仅是机器学习工程师)能够轻松进行AI模型的微调。OpenAI首席产品官近期分享了微调技术在从客户支持到深度研究等领域的广泛应用,并称其为严肃AI团队的未来...

Read More
2025-05-01 talkingdev

[开源]DeepSeek-Prover-V2:AI自动定理证明框架升级版发布

DeepSeek团队近日在GitHub开源了其第二代自动定理证明框架DeepSeek-Prover-V2,该项目迅速获得326个Hacker News点赞和63条技术讨论,显示出学术界和工业界对AI形式化验证工具的高度关注。作为当前最前沿的AI推理系统...

Read More
2025-04-30 talkingdev

图灵GenAI与LLM评估工具:5分钟快速诊断AI战略瓶颈

图灵公司推出的GenAI与LLM评估工具为AI项目负责人提供了一种高效的自我诊断方案,旨在识别从人才缺口到规模化挑战等后训练阶段的战略瓶颈。该工具仅需五分钟即可生成针对性的后续步骤建议和资源推荐,特别适用于基于...

Read More
2025-04-29 talkingdev

Valeo AI推出VaViM和VaVAM:生成式视频模型革新自动驾驶轨迹预测

Valeo AI最新发布了两项突破性技术:VaViM自回归视频模型和VaVAM驾驶轨迹预测模型。VaViM通过时空令牌序列预测技术,实现了对连续视频帧的高精度建模;而VaVAM则创新性地将学习到的视频表征通过模仿学习转化为可执行...

Read More
2025-04-29 talkingdev

[论文推荐]ReLearn:大语言模型高效遗忘学习的数据增强与微调方案

来自arXiv的最新研究论文提出ReLearn框架,通过创新的数据增强和微调技术,解决了大语言模型(LLMs)中的关键挑战——'遗忘学习'(Unlearning)。该技术可精准移除模型训练数据中的特定信息,同时保持整体性能,对数据...

Read More
2025-04-29 talkingdev

[论文推荐] 多重填补方法处理缺失标签:MNAR条件下的稳健分类器评估

近期发表于arXiv的一篇研究论文提出了一种针对缺失标签的多重填补方法,为机器学习领域中的分类器评估提供了创新解决方案。该方法通过多重填补技术生成预测分布,即使在数据缺失非随机(MNAR)的复杂条件下,仍能保...

Read More
2025-04-28 talkingdev

[论文推荐]DisenGCD认知诊断模型:基于解耦图学习框架提升学习表征能力

DisenGCD作为认知诊断领域的前沿模型,通过创新的解耦图学习框架(Disentangled Graph Learning Framework),实现了对学生、习题及概念表征的三元关系深度建模。该技术突破性地将传统认知诊断中的耦合特征进行解耦...

Read More
  1. Prev Page
  2. 22
  3. 23
  4. 24
  5. Next Page