加州大学伯克利分校的研究团队近日发表博客文章,详细阐述了他们在构建可信赖的AI智能体基准测试方面取得的突破性进展。文章指出,当前许多流行的AI智能体基准测试存在设计缺陷,容易被特定策略“破解”或产生误导性结...
Read More据《金融时报》报道,阿里巴巴集团近期进行了一次重要的人事与战略调整。集团已任命阿里云首席技术官周靖人兼任其人工智能(AI)部门的负责人。这一变动紧随公司AI战略的重大转向而发生:阿里巴巴正将其通义千问(Qw...
Read MoreMeta公司正加速推进其新一代人工智能模型的发布进程。据最新报道,该公司即将推出的一系列AI模型中,部分将最终以开源许可证的形式向公众开放。这一举措延续了Meta此前通过Llama系列模型所践行的开源路线。公司首席...
Read More开源回合制策略游戏《韦诺之战》(Battle for Wesnoth)近期在技术社区引发广泛关注,其官方网站在知名技术论坛Hacker News上获得了443点的高热度评分,并积累了125条深度讨论。这款游戏自2003年发布以来,凭借其开...
Read More一项名为‘简单自蒸馏’(Simple Self-Distillation, SSD)的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于,仅利用模型自身在特定采样配置(如温度参数和截断策略)下生成...
Read More近日,科技界发生了一件颇具象征意义的事件:苹果公司批准了一款允许Nvidia外置显卡(eGPU)在基于Arm架构的Mac电脑上工作的驱动程序。这款驱动并非由Nvidia官方提供,而是来自一家名为Tiny Corp的公司。其最大突破...
Read More人工智能公司Anthropic近日向用户发出通知,宣布自太平洋时间4月4日中午12点起,将调整其Claude API的使用政策。根据新规,用户将无法再使用其Claude订阅额度(包括Claude Code和Claude Cowork产品)通过第三方集成...
Read More近日,SafeAI-Lab-X团队在GitHub上开源了名为ClawKeeper的安全防护框架,旨在为OpenClaw系列自主智能体提供全面的实时安全保障。该框架被喻为“OpenClaw的诺顿”,其核心创新在于构建了一个多层次、纵深防御的安全体系...
Read More