漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-06 talkingdev

Anthropic发布Claude Opus 4.6:旗舰模型全面升级,推理与编程能力再攀高峰

人工智能公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大模型在智能体能力、任务持久性和复杂场景应用上取得了显著进步。该模型在智能体编码、计算机使用、工具调用、...

Read More
2026-02-04 talkingdev

Deno发布Sandbox平台:为LLM生成代码打造深度防御安全微虚拟机

Deno公司近日正式推出Deno Sandbox平台,这是一项专为安全执行不可信代码设计的前沿基础设施服务,尤其针对当前大语言模型(LLM)生成代码的安全运行难题提供了创新解决方案。该平台的核心技术在于采用轻量级Linux微...

Read More
2026-02-03 talkingdev

深度解析:OpenAI Codex CLI核心代理循环如何协同模型与工具

OpenAI近期发布的Codex CLI是一款跨平台的本地软件代理,其核心机制——代理循环(agent loop)——代表了当前AI代理技术的前沿方向。该循环系统性地编排了用户、大语言模型与各类工具之间的交互流程:它首先迭代式地构...

Read More
2026-02-03 talkingdev

论文推荐|NVIDIA提出“金鹅”方法:从未经验证的网络文本中无限合成RLVR任务,突破大模型强化学习瓶颈

近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...

Read More
2026-02-03 talkingdev

开源模型逆袭!GPT-OSS 120B通过DPO微调,在人类偏好对齐任务上超越GPT-5.2

一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...

Read More
2026-02-02 talkingdev

开源|Dash:受OpenAI内部实现启发的自学习数据代理,以六层上下文为答案奠基

近日,GitHub上开源了一个名为Dash的自学习数据代理项目,其设计灵感来源于OpenAI的内部实现。该项目旨在解决原始大型语言模型在生成SQL时普遍存在的痛点,例如因上下文缺失、缺乏团队内部知识(Tribal Knowledge)...

Read More
2026-02-01 talkingdev

开源|零成本构建个人量化助手:LLM驱动多市场股票智能分析器GitHub走红

名为“daily_stock_analysis”的开源项目在利用大型语言模型(LLM)技术,为个人投资者打造一个功能全面且完全免费的智能股票分析工具。其核心设计理念是“零成本,纯白嫖”,通过整合多数据源行情、实时新闻资讯,并调...

Read More
2026-01-31 talkingdev

OpenAI揭秘内部GPT-5.2驱动AI数据代理:员工可对超600PB数据进行自然语言分析

OpenAI近日披露了其专为内部研发定制的AI数据代理系统。该系统由该公司尚未公开发布的最新模型GPT-5.2驱动,旨在赋能其员工,使其能够通过自然语言直接对超过600PB(约60万TB)的庞大数据集进行交互式查询与分析。Op...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page