漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-03 talkingdev

开源模型逆袭!GPT-OSS 120B通过DPO微调,在人类偏好对齐任务上超越GPT-5.2

一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...

Read More
2026-01-31 talkingdev

开源|仅9M参数!开发者打造浏览器端普通话发音AI导师,实时纠正声调

近日,一位开发者为解决自身普通话声调学习的痛点,训练并开源了一个超轻量级的语音评估模型。该模型专门用于对普通话的发音和声调进行实时评分与纠正,为解决语言学习中“听不出自身错误”的普遍难题提供了技术方案。...

Read More
2026-01-28 talkingdev

Vercel研究:AGENTS.md以100%通过率碾压传统技能包,AI代码代理知识更新迎来新范式

在AI编程助手领域,一个长期存在的痛点是模型知识库的滞后性,这常导致其生成基于过时API的代码。Vercel的研究团队针对这一核心问题,对两种为AI代理提供最新Next.js 16框架文档的方法进行了系统性评估。传统方案“技...

Read More
2026-01-24 talkingdev

谷歌收购Common Sense Machines,AI新秀可将2D图像生成3D资产

据The Information报道,谷歌已正式收购位于马萨诸塞州剑桥的初创公司Common Sense Machines。该公司专注于开发生成式人工智能模型,其核心技术在于能够将简单的二维图像高效、准确地转化为可用于游戏、虚拟现实、数...

Read More
2026-01-22 talkingdev

AI成本压力显现:Anthropic大幅下调2025年毛利率预期至40%,因推理成本飙升

根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...

Read More
2026-01-01 talkingdev

开源|E2E:基于JAX的端到端测试时训练框架,革新长上下文语言建模

近日,GitHub上开源了一个名为E2E的JAX官方实现项目,它提出了一种创新的长上下文语言建模方法。该方法的核心在于将传统的语言建模任务重新定义为持续学习问题。E2E模型采用标准的Transformer架构,并配合滑动窗口注...

Read More
2026-01-01 talkingdev

开源|LMCache:为LLM服务注入极速KV缓存层,响应速度提升3-10倍

近日,一个名为LMCache的开源项目在GitHub上发布,旨在通过创新的键值(KV)缓存加速层,显著提升大型语言模型(LLM)的服务性能。该项目专为LLM推理服务设计,其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

Read More
2025-12-28 talkingdev

科技生活观察:警惕“预测性依赖”,互联网应是信息工具而非人生预言家

近期,在社交媒体和各类论坛上,一种值得警惕的现象日益凸显:许多用户倾向于通过互联网寻求对个人具体境遇的“预测性建议”,以期在面临不确定性时获得心理安全感。这种行为模式背后,反映的是对数字信息环境的过度依...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page