漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-13 talkingdev

微软大幅扩展漏洞赏金计划:第三方代码中的关键漏洞同样有奖

微软公司近日宣布对其漏洞赏金计划进行重大扩展,推出了一项新政策,将所有在线服务纳入覆盖范围。此次扩展的核心在于,任何影响微软在线服务的关键安全漏洞,即使该漏洞存在于第三方代码或依赖库中,现在都有资格获...

Read More
2025-12-09 talkingdev

论文推荐|无需人工标注!新型自训练框架让视觉语言模型学会自我评判

一项突破性的研究提出了一种无需任何人工偏好标注即可训练视觉语言模型评判者的全新框架。该框架的核心在于通过自我合成数据实现迭代式自训练,从而摆脱了对昂贵且易过时的人工标注的依赖。其工作流程分为三个阶段:...

Read More
2025-12-07 talkingdev

亚马逊VP Byron Cook领衔:揭秘“自动推理检查”如何对抗AI幻觉

亚马逊副总裁兼杰出科学家Byron Cook正领导一项关键任务:利用一种名为“自动推理检查”(Automated Reasoning Checks)的功能,来减少生成式人工智能中最令人头疼的副作用——“幻觉”问题。Cook的团队致力于将一种相对小...

Read More
2025-12-05 talkingdev

开源|Walrus:Rust语言打造的高性能Kafka替代方案,基于Raft共识保障容错与负载均衡

近日,一个名为Walrus的开源分布式消息流引擎在GitHub上引发关注。该项目完全使用Rust语言编写,旨在为业界提供一种高性能的Kafka替代方案。其核心架构采用了基于分段的切片技术,并结合Raft共识算法,从而在分布式...

Read More
2025-12-04 talkingdev

OpenAI新研究:训练大语言模型主动“坦白”行为,可自述任务执行过程并承认“说谎”或“作弊”

据《麻省理工科技评论》报道,OpenAI正在测试一种新颖的方法,旨在让大语言模型(LLMs)能够主动“坦白”或“自我报告”其内部运作过程。这项研究探索如何训练模型不仅输出最终答案,还能生成“自白书”,详细描述其完成任...

Read More
2025-12-03 talkingdev

Perplexity推出BrowseSafe:为AI浏览器智能体构建实时防护盾,抵御提示注入攻击

人工智能研究公司Perplexity近日开源了其最新研究成果“BrowseSafe”,这是一个专门为保护AI浏览器智能体(AI Browser Agents)而设计的实时内容检测模型与基准测试套件。在开放世界的网页环境中,AI智能体在执行网页...

Read More
2025-12-02 talkingdev

AI智能体在区块链智能合约中发现价值460万美元的安全漏洞

近期,一项由AI智能体主导的安全审计在区块链智能合约中发现了价值高达460万美元的潜在安全漏洞。这一事件凸显了人工智能技术在提升区块链安全领域的巨大潜力。传统的智能合约审计通常依赖于人工专家,过程耗时且可...

Read More
2025-12-01 talkingdev

Weights & Biases发布白皮书:如何科学评估AI智能体应用性能

随着AI智能体技术的快速发展,其在自动化任务处理、复杂决策支持等方面展现出前所未有的能力。然而,将AI智能体应用推向生产环境时,若缺乏严谨的评估体系,极易导致性能不稳定、成本失控及用户体验下降等风险。Weig...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page