漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-03 talkingdev

开源模型逆袭!GPT-OSS 120B通过DPO微调,在人类偏好对齐任务上超越GPT-5.2

一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...

Read More
2026-01-31 talkingdev

开源|月之暗面发布最强模型Kimi K2.5技术报告,引发开发者社区热议

近日,国内人工智能公司月之暗面(Moonshot AI)在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开,迅速吸引了全球开发者与AI研究者的高度关注,在知名技术社区Hacker News上获得...

Read More
2026-01-30 talkingdev

深度剖析:OpenAI的GPT-5经济账本,盈利之路道阻且长

根据Exponential View与Epoch AI的联合分析,OpenAI旗下GPT-5等模型的经济状况比其首席执行官Sam Altman和Anthropic联合创始人Dario Amodei所暗示的更为严峻。报告指出,运行和开发此类前沿大语言模型的单位经济效益...

Read More
2026-01-29 talkingdev

LM Studio 0.4.0发布:支持服务器部署与连续批处理并行请求,大幅提升本地大模型推理效率

近日,备受开发者关注的本地大语言模型运行平台LM Studio发布了其0.4.0版本更新。本次更新带来了多项关键性功能升级,核心聚焦于提升生产环境下的部署能力与推理性能。最引人注目的新特性是支持服务器部署模式,这使...

Read More
2026-01-27 talkingdev

开源|SWE-Pruner:代码智能体上下文剪枝框架,令牌消耗锐减超50%

近日,GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架,旨在显著优化代码智能体(Coding Agents)在处理复杂软件工程任务时的效率与成本。该框架的核心在于,通过一个轻量级模型动态分析与...

Read More
2026-01-26 talkingdev

开源|字节跳动Seed团队发布Stable-DiffCoder:基于扩散模型的轻量级代码大语言模型

字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目,这是一个基于扩散模型(Diffusion Model)构建的轻量级代码大语言模型(Code DLLM)家族。该项目创新性地将扩散模型的生成范式引入代码建模领域,通过“块扩...

Read More
2026-01-26 talkingdev

开源|TTT-Discover:推理时强化学习新范式,让大模型实时自适应任务

近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...

Read More
2026-01-24 talkingdev

谷歌相册推出AI新功能“Me Meme”,用户可将个人照片一键生成表情包

谷歌近日在其相册应用中推出了一项名为“Me Meme”的全新生成式AI功能,该功能允许用户利用自己的个人照片快速创建个性化表情包。此项功能率先在美国市场推出,标志着生成式人工智能在个人娱乐和内容创作领域的应用进...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page