漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-20 talkingdev

[论文推荐]提升大语言模型细粒度子词理解能力的新方法:StochasTok

最新研究表明,通过StochasTok训练方法可显著提升大语言模型对子词结构的理解能力。该创新技术采用随机分解标记的策略,在训练过程中让模型以多种拆分形式接触词汇(如将'strawberry'随机拆分为'straw|berry'、'str|...

Read More
2025-06-20 talkingdev

语言模型推理经济学:为何当前扩展方法遭遇瓶颈

首份关于大语言模型(LLM)服务经济学的综合模型揭示,随着AI公司竞相部署高token消耗的推理模型和智能体,当前扩展推理能力的方法比预期更快遭遇瓶颈。研究发现,网络延迟而非带宽成为主要瓶颈,阻碍了公司通过简单...

Read More
2025-06-19 talkingdev

Workout.cool-开源健身教练平台,助力个性化训练计划制定

开发者Snouzy近日发布了全新的开源健身教练平台Workout.cool,这是其此前广受欢迎的开源项目workout.lol的迭代版本。原项目曾获得1.4k GitHub星标和约2万月访问量,但因视频版权问题被出售后陷入停滞。新版本从零开...

Read More
2025-06-19 talkingdev

AI文档撰写最佳实践:提升RAG系统效能的关键

Kapa.ai最新发布的文档《Writing documentation for AI: best practices》详细探讨了为AI系统撰写高效文档的核心原则,尤其针对检索增强生成(RAG)技术栈的优化需求。文章指出,RAG系统的性能高度依赖知识库文档的...

Read More
2025-06-18 talkingdev

MiniMax开源推理模型M1:混合专家架构+闪电注意力

人工智能公司MiniMax在GitHub开源了其4560亿参数规模的推理模型M1,该模型采用创新的混合专家架构(MoE)并引入'闪电注意力'技术,实现百万token级别的超长上下文处理能力(相当于DeepSeek R1的8倍)。特别值得注意...

Read More
2025-06-18 talkingdev

AI时代职业指南:如何避免被自动化取代的关键技能

最新发布的职业发展指南指出,在人工智能快速普及的背景下,某些技能反而会因自动化浪潮而增值。该报告由知名职业规划平台80000 Hours发布,重点分析了AI部署能力、领导力以及政府关系处理等三大抗自动化技能。报告...

Read More
2025-06-17 talkingdev

[论文推荐]TreeRL:无需奖励模型的LLM训练新方法,数学与代码推理能力显著提升

TreeRL是一种创新的语言模型训练方法,通过结合on-policy树搜索和中间监督机制,实现了无需单独奖励模型的LLM训练。这一技术突破来自最新arXiv论文,相比传统的ChainRL方法,TreeRL在数学推理和代码生成等复杂任务上...

Read More
2025-06-17 talkingdev

OpenAI提出AI情感边界:温暖但非生命体

OpenAI模型行为与政策负责人近日阐述了公司对用户与ChatGPT建立情感连接现象的管理策略。尽管从科学角度尚无法证实AI是否具备意识,OpenAI明确表示要避免在缺乏证据的情况下让用户误认为AI模型具有感知能力。该公司...

Read More
  1. Prev Page
  2. 28
  3. 29
  4. 30
  5. Next Page