漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-14 talkingdev

开源|CaRR:为深度搜索智能体引入引文感知的规则奖励,提升强化学习鲁棒性

清华大学知识工程实验室(THUDM)在GitHub开源了项目CaRR,其对应论文《Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards》提出了一种创新方法,...

Read More
2026-01-08 talkingdev

论文推荐|WebGym:为视觉网页智能体构建近30万真实任务的大规模训练场,性能超越GPT-4o

近日,研究人员推出了迄今为止最大规模的开源环境WebGym,专门用于训练能够处理真实世界网页任务的视觉智能体。该环境的核心价值在于解决了现有训练集的局限性:人工合成或小规模任务集无法应对真实网站的多样性和非...

Read More
2025-12-12 talkingdev

前沿探索:机器学习研究亟待解决的四大开放性问题

近日,一篇题为《Prompts for Open Problems》的文章在机器学习研究社区引发了广泛讨论。文章作者系统性地提出了四个具有高度前瞻性和可行性的研究方向,旨在推动领域突破现有范式。首先,“基于设计的机器学习”倡导...

Read More
2025-12-04 talkingdev

Vercel推出Remend:首个自动修复流式Markdown中断的npm包

Vercel近日发布了一款名为Remend的全新独立npm包,该工具旨在解决实时流式传输中Markdown内容因网络中断或处理延迟而导致的语法结构不完整问题。Remend的核心技术在于其智能的预处理器机制,能够自动检测并补全未闭...

Read More
2025-12-03 talkingdev

Perplexity推出BrowseSafe:为AI浏览器智能体构建实时防护盾,抵御提示注入攻击

人工智能研究公司Perplexity近日开源了其最新研究成果“BrowseSafe”,这是一个专门为保护AI浏览器智能体(AI Browser Agents)而设计的实时内容检测模型与基准测试套件。在开放世界的网页环境中,AI智能体在执行网页...

Read More
2025-12-02 talkingdev

开源|ViBT:20B参数视觉桥接Transformer,高效图像与视频编辑新突破

近日,GitHub上开源了一个名为ViBT(Vision Bridge Transformer)的项目,该项目将布朗桥模型(Brownian Bridge Models)扩展至高达200亿参数规模,专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...

Read More
2025-10-05 talkingdev

开源|ProofOfThought:基于Z3定理证明的LLM神经符号推理框架

NeurIPS 2024系统推理研讨会最新收录的研究项目ProofOfThought提出了一种突破性的神经符号编程合成方法,通过结合大型语言模型的语义理解能力与Z3定理证明器的形式化验证机制,实现了兼具鲁棒性与可解释性的自动推理...

Read More
2025-10-04 talkingdev

瑞典央行设定2026年最后期限:离线银行卡支付将成现实

瑞典央行近日发布公告,要求所有支付服务提供商最迟于2026年7月1日前实现离线银行卡支付功能。这项技术突破将允许用户在无网络连接环境下完成交易,通过芯片卡内置的加密算法和本地验证机制保障支付安全。该政策标志...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page