漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-04 talkingdev

论文推荐|SWE-Universe:从GitHub PR构建百万级可验证软件工程环境

近日,一项名为SWE-Universe的研究提出了一种革命性的可扩展框架,旨在从GitHub的拉取请求中自动构建真实世界的软件工程可验证环境。该研究成功解决了自动化构建中长期存在的三大挑战:构建成功率低、验证机制薄弱以...

Read More
2026-02-04 talkingdev

开源AI生态全景展望:从DeepSeek时刻到AI+时代

近日,Hugging Face发布深度博文,系统回顾了自“DeepSeek时刻”以来全球开源人工智能生态的发展轨迹。文章指出,以DeepSeek为代表的开源模型发布事件,标志着AI发展进入了一个由开放协作驱动的新阶段。该文深入剖析了...

Read More
2026-02-03 talkingdev

深度解析:OpenAI Codex CLI核心代理循环如何协同模型与工具

OpenAI近期发布的Codex CLI是一款跨平台的本地软件代理,其核心机制——代理循环(agent loop)——代表了当前AI代理技术的前沿方向。该循环系统性地编排了用户、大语言模型与各类工具之间的交互流程:它首先迭代式地构...

Read More
2026-02-03 talkingdev

论文推荐|NVIDIA提出“金鹅”方法:从未经验证的网络文本中无限合成RLVR任务,突破大模型强化学习瓶颈

近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...

Read More
2026-02-03 talkingdev

开源模型逆袭!GPT-OSS 120B通过DPO微调,在人类偏好对齐任务上超越GPT-5.2

一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...

Read More
2026-02-02 talkingdev

开源|Dash:受OpenAI内部实现启发的自学习数据代理,以六层上下文为答案奠基

近日,GitHub上开源了一个名为Dash的自学习数据代理项目,其设计灵感来源于OpenAI的内部实现。该项目旨在解决原始大型语言模型在生成SQL时普遍存在的痛点,例如因上下文缺失、缺乏团队内部知识(Tribal Knowledge)...

Read More
2026-02-02 talkingdev

开源|OpenClaw发布:本地化开源AI助手平台,集成多款主流通讯应用

近日,开源AI助手平台OpenClaw正式发布,标志着从早期ClawdBot到Moltbot的演进进入新阶段。该平台的核心设计理念是隐私与用户控制,其作为开源项目,允许用户在本地机器上部署和运行,从而确保数据处理的私密性。平...

Read More
2026-02-02 talkingdev

开源|从像素到字符:揭秘GitHub Copilot CLI动态ASCII横幅背后的工程艺术

GitHub工程团队近日分享了为Copilot CLI命令行工具打造动态ASCII横幅的深度技术实践。在终端这一高度受限的UI环境中实现流畅动画,是一项极具挑战的工程问题。团队面临三大核心难题:不同终端对ANSI颜色代码的解析不...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page