漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-22 talkingdev

开源Bloom工具:自动化评估AI模型行为,提升安全性与可解释性

Anthropic近日开源了名为Bloom的工具,这是一个专门用于对AI模型进行自动化行为评估的开源解决方案。该工具通过创建特定场景并量化不同模型中的行为发生率,能够系统性地评估如自我偏好偏见、蓄意破坏等具体行为模式...

Read More
2025-12-21 talkingdev

评估报告:Claude Opus 4.5任务处理“半衰期”达4小时49分,性能较前代翻倍

人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...

Read More
2025-12-21 talkingdev

Claude推出Chrome浏览器扩展,AI助手深度集成工作流

人工智能公司Anthropic近日正式发布了“Claude in Chrome”浏览器扩展,标志着其旗舰AI助手Claude进一步向日常生产力工具渗透。该扩展允许用户直接在Chrome浏览器中调用Claude的对话与推理能力,实现实时问答、网页内...

Read More
2025-12-20 talkingdev

估值达10亿美元!Resolve AI完成A轮融资,致力于开发自主化站点可靠性工程工具

据TechCrunch报道,由前Splunk高管创立的初创公司Resolve AI,已成功完成A轮融资。此轮融资引人注目的亮点在于其采用了多层级估值方案,其中最高估值层级达到了10亿美元。Resolve AI的核心产品是一款旨在实现自主化...

Read More
2025-12-20 talkingdev

2025年大语言模型范式变革年度回顾:关键趋势与未来展望

知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...

Read More
2025-12-16 talkingdev

开源|Metacode:为代码注释定义机器可读标准语言,提升开发工具智能化水平

近日,GitHub上开源项目Metacode引发开发者社区关注。该项目旨在解决代码注释的机器可读性问题,提出了一种基于Python语法的标准语言规范,并提供了开箱即用的解析器。这一创新类似于Python生态中各类源码分析工具(...

Read More
2025-12-16 talkingdev

开源|Claude Mem:为AI编程助手注入“持久记忆”,实现跨项目知识连续性

近日,一个名为Claude Mem的开源项目在GitHub上发布,为Anthropic公司的Claude Code编程助手插件带来了革命性的“持久记忆”能力。该插件能够自动捕获并记录Claude在编码会话中的所有操作与工具使用观察,随后利用AI技...

Read More
2025-12-14 talkingdev

专访微软AI CEO:定义超级智能、医疗应用与全民基本收入,AI竞赛进入烧钱新阶段

彭博社记者Mishal Husain近期对微软人工智能首席执行官穆斯塔法·苏莱曼进行了深度访谈,探讨了人工智能领域的前沿议题。苏莱曼阐述了其对“超级智能”的定义,即超越人类在所有认知任务上能力的通用人工智能系统。他特...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page