漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-09 talkingdev

开源|GitHub推出Agentic Workflows:用自然语言定义AI驱动的代码库自动化

GitHub近日正式推出Agentic Workflows,这是一项旨在深度集成于GitHub Actions平台、通过AI编码代理实现代码库自动化管理的前沿功能。用户无需编写复杂的YAML脚本,仅需使用Markdown文件以自然语言描述期望的自动化...

Read More
2026-02-06 talkingdev

Anthropic发布Claude Opus 4.6:智能体编码与复杂推理能力再升级

人工智能研究公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大语言模型在专业应用领域的能力边界再次被拓展。该模型在智能体编码、计算机使用、工具调用、信息检索及金...

Read More
2026-02-06 talkingdev

Anthropic发布Claude Opus 4.6:旗舰模型全面升级,推理与编程能力再攀高峰

人工智能公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大模型在智能体能力、任务持久性和复杂场景应用上取得了显著进步。该模型在智能体编码、计算机使用、工具调用、...

Read More
2026-02-04 talkingdev

Deno发布Sandbox平台:为LLM生成代码打造深度防御安全微虚拟机

Deno公司近日正式推出Deno Sandbox平台,这是一项专为安全执行不可信代码设计的前沿基础设施服务,尤其针对当前大语言模型(LLM)生成代码的安全运行难题提供了创新解决方案。该平台的核心技术在于采用轻量级Linux微...

Read More
2026-02-03 talkingdev

深度解析:OpenAI Codex CLI核心代理循环如何协同模型与工具

OpenAI近期发布的Codex CLI是一款跨平台的本地软件代理,其核心机制——代理循环(agent loop)——代表了当前AI代理技术的前沿方向。该循环系统性地编排了用户、大语言模型与各类工具之间的交互流程:它首先迭代式地构...

Read More
2026-02-03 talkingdev

论文推荐|NVIDIA提出“金鹅”方法:从未经验证的网络文本中无限合成RLVR任务,突破大模型强化学习瓶颈

近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...

Read More
2026-02-03 talkingdev

开源模型逆袭!GPT-OSS 120B通过DPO微调,在人类偏好对齐任务上超越GPT-5.2

一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...

Read More
2026-01-31 talkingdev

开源|月之暗面发布最强模型Kimi K2.5技术报告,引发开发者社区热议

近日,国内人工智能公司月之暗面(Moonshot AI)在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开,迅速吸引了全球开发者与AI研究者的高度关注,在知名技术社区Hacker News上获得...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page