漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-22 talkingdev

开源Bloom工具:自动化评估AI模型行为,提升安全性与可解释性

Anthropic近日开源了名为Bloom的工具,这是一个专门用于对AI模型进行自动化行为评估的开源解决方案。该工具通过创建特定场景并量化不同模型中的行为发生率,能够系统性地评估如自我偏好偏见、蓄意破坏等具体行为模式...

Read More
2025-12-21 talkingdev

评估报告:Claude Opus 4.5任务处理“半衰期”达4小时49分,性能较前代翻倍

人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...

Read More
2025-12-21 talkingdev

Claude推出Chrome浏览器扩展,AI助手深度集成工作流

人工智能公司Anthropic近日正式发布了“Claude in Chrome”浏览器扩展,标志着其旗舰AI助手Claude进一步向日常生产力工具渗透。该扩展允许用户直接在Chrome浏览器中调用Claude的对话与推理能力,实现实时问答、网页内...

Read More
2025-12-19 talkingdev

Anthropic在Chrome中试点Claude AI,集成Claude Code实现浏览器内代码测试与验证

人工智能公司Anthropic近日宣布,正在Chrome浏览器中试点其AI助手Claude,旨在测试基于浏览器的AI能力,并为更广泛的发布构建必要的安全措施。此次试点的一个关键亮点是Claude与Claude Code的深度集成。Claude Code...

Read More
2025-12-19 talkingdev

AI智能体能力标准化迈出关键一步:Agent Skills成为开放格式,获Cursor、GitHub、VS Code等巨头支持

在人工智能技术快速演进,特别是AI智能体(Agent)应用日益普及的背景下,一项旨在统一和扩展智能体能力的核心技术规范——Agent Skills,正式确立为开放标准。该标准最初由人工智能研究公司Anthropic(同时也是模型上...

Read More
2025-12-16 talkingdev

开源|Claude Mem:为AI编程助手注入“持久记忆”,实现跨项目知识连续性

近日,一个名为Claude Mem的开源项目在GitHub上发布,为Anthropic公司的Claude Code编程助手插件带来了革命性的“持久记忆”能力。该插件能够自动捕获并记录Claude在编码会话中的所有操作与工具使用观察,随后利用AI技...

Read More
2025-12-16 talkingdev

英伟达发布Nemotron 3开源模型家族,以开放生态挑战OpenAI等巨头

英伟达近日正式发布了Nemotron 3系列开源模型,该家族包含Nano(300亿参数,30亿活跃参数)、Super(1000亿参数)和Ultra(5000亿参数)三个版本,其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是,当前...

Read More
2025-12-15 talkingdev

开源|AI深度解析37signals代码库,Claude Code生成非官方Rails风格指南

近日,一份基于人工智能深度分析生成的《非官方37signals/DHH Rails风格指南》在开发者社区引发关注。该指南并非由37signals官方发布,而是开发者利用Anthropic公司的Claude Code工具,对其开源项目管理工具Fizzy的...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page