漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-04 talkingdev

Deno发布Sandbox平台:为LLM生成代码打造深度防御安全微虚拟机

Deno公司近日正式推出Deno Sandbox平台,这是一项专为安全执行不可信代码设计的前沿基础设施服务,尤其针对当前大语言模型(LLM)生成代码的安全运行难题提供了创新解决方案。该平台的核心技术在于采用轻量级Linux微...

Read More
2026-02-03 talkingdev

论文推荐|NVIDIA提出“金鹅”方法:从未经验证的网络文本中无限合成RLVR任务,突破大模型强化学习瓶颈

近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...

Read More
2026-02-03 talkingdev

开源模型逆袭!GPT-OSS 120B通过DPO微调,在人类偏好对齐任务上超越GPT-5.2

一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...

Read More
2026-02-02 talkingdev

开源|Dash:受OpenAI内部实现启发的自学习数据代理,以六层上下文为答案奠基

近日,GitHub上开源了一个名为Dash的自学习数据代理项目,其设计灵感来源于OpenAI的内部实现。该项目旨在解决原始大型语言模型在生成SQL时普遍存在的痛点,例如因上下文缺失、缺乏团队内部知识(Tribal Knowledge)...

Read More
2026-02-01 talkingdev

开源|零成本构建个人量化助手:LLM驱动多市场股票智能分析器GitHub走红

名为“daily_stock_analysis”的开源项目在利用大型语言模型(LLM)技术,为个人投资者打造一个功能全面且完全免费的智能股票分析工具。其核心设计理念是“零成本,纯白嫖”,通过整合多数据源行情、实时新闻资讯,并调...

Read More
2026-01-29 talkingdev

开源|Sherlock:实时监控LLM API流量与令牌消耗的终端仪表盘工具

近日,开发者jmuncor在GitHub上开源了一个名为Sherlock的工具,它是一个专门用于拦截和可视化大型语言模型API流量的中间人代理。该工具源于开发者对Claude Code等AI开发工具实际API通信内容的好奇心。Sherlock部署在...

Read More
2026-01-26 talkingdev

开源|字节跳动Seed团队发布Stable-DiffCoder:基于扩散模型的轻量级代码大语言模型

字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目,这是一个基于扩散模型(Diffusion Model)构建的轻量级代码大语言模型(Code DLLM)家族。该项目创新性地将扩散模型的生成范式引入代码建模领域,通过“块扩...

Read More
2026-01-26 talkingdev

开源|TTT-Discover:推理时强化学习新范式,让大模型实时自适应任务

近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page