漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-11 talkingdev

开源|AIRS-Bench:Meta发布首个端到端AI研究能力基准,量化大模型代理的科研潜力

Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...

Read More
2026-02-10 talkingdev

开源|ClawSec:为AI智能体打造的全栈安全技能套件在GitHub发布

近日,一个名为ClawSec的综合性安全技能套件在GitHub开源发布,该项目专为OpenClaw系列AI智能体设计,旨在为AI代理的运行环境提供端到端的安全防护。该套件集成了多项前沿安全技术,包括自动化安全审计、实时安全建...

Read More
2026-02-07 talkingdev

开源|Monty:专为AI设计的Rust编写轻量安全Python解释器

Pydantic团队近日在GitHub开源了Monty项目,这是一个用Rust语言编写的极简、安全的Python解释器,专为人工智能应用场景设计。该项目在Hacker News技术社区引发广泛关注,获得162个技术点赞和75条深度讨论,显示出业...

Read More
2026-01-26 talkingdev

开源|TTT-Discover:推理时强化学习新范式,让大模型实时自适应任务

近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...

Read More
2026-01-24 talkingdev

深度解析:OpenAI揭秘Codex智能体循环机制,AI自主决策能力再进一步

OpenAI技术团队成员Michael Bolin近期发表了一篇题为《Unrolling the Codex agent loop》的技术文章,深入剖析了基于Codex模型的智能体(Agent)在执行复杂任务时的内部循环机制。该文章揭示了AI智能体如何通过“感知...

Read More
2026-01-15 talkingdev

开源|Vercel推出JSON Render:为AI生成UI加上“安全护栏”,让提示词直接构建可预测界面

Vercel实验室近日在GitHub上开源了名为“JSON Render”的创新库,旨在解决AI生成用户界面(UI)时的安全性与可控性难题。该库的核心思路是“AI → JSON → UI”,即让大型语言模型等AI系统根据自然语言提示(prompts)生成...

Read More
2026-01-06 talkingdev

英伟达发布开源AI模型家族Alpamayo,加速基于推理的自动驾驶开发

英伟达今日正式发布了名为Alpamayo的开源AI模型家族,并配套推出了仿真工具与数据集,旨在加速下一代基于推理的安全型自动驾驶系统的开发进程。这一系列模型、数据集和仿真器主要针对自动驾驶领域中的“长尾挑战”——即...

Read More
2026-01-05 talkingdev

开源|HGMem:超图工作记忆框架提升LLM复杂关系推理能力

近日,一个名为HGMem的开源项目在GitHub上发布,该项目实现了一篇题为《Improving Multi-step RAG with Hypergraph-based Memory for Long-context Complex Relational Modeling》的论文。HGMem是一个基于超图的工作...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page