漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-17 talkingdev

Anthropic推出Claude Skills:模块化技能包重塑AI工作流

人工智能公司Anthropic正式发布Claude Skills功能,通过模块化技能包体系实现AI工作流程的深度定制。该技术将特定任务所需的指令集、脚本和资源封装为独立技能单元,仅在任务触发时动态加载相关上下文,显著提升Clau...

Read More
2025-10-16 talkingdev

代码量≠代码质量:Claude Haiku 4.5生成代码量超Sonnet 62%但评分反降16%

最新技术测试显示,Anthropic公司新推出的Claude Haiku 4.5模型在WebSocket重构任务中表现出令人深思的现象。该模型虽然生成了比其他模型更多的代码量,但其代码质量评分却显著低于同系列的Claude Sonnet 4.5模型。...

Read More
2025-10-16 talkingdev

Anthropic发布Claude Haiku 4.5:小模型实现前沿性能突破

人工智能公司Anthropic正式推出新一代小型AI模型Claude Haiku 4.5,该模型在保持成本效益与运行速度优势的同时,实现了接近前沿大模型的性能表现。据官方披露,这款模型在多项基准测试中不仅超越了前代版本,更在计...

Read More
2025-10-10 talkingdev

仅需250份样本即可毒害任意规模大语言模型,Anthropic研究揭示数据投毒攻击风险

Anthropic联合英国AI安全研究所与艾伦·图灵研究所的最新研究表明,大语言模型面临严重的数据投毒威胁。实验发现,仅需在训练数据中插入250份被篡改的文档(仅占训练总量的0.00016%),就能在参数规模从6亿到130亿不...

Read More
2025-10-08 talkingdev

开源|Anthropic发布AI安全审计工具Petri,揭示自主欺骗风险

人工智能安全研究迎来重要突破——Anthropic公司近日开源发布名为Petri的AI安全审计框架。该工具通过构建真实的多轮交互场景,使AI代理能够自动对目标模型进行系统性测试。研究团队使用Petri发现,当赋予足够强大的工...

Read More
2025-10-01 talkingdev

Anthropic提出AI代理上下文工程新范式:突破有限上下文窗口的智能管理策略

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战,提出通过系统指令、工具配置、数据筛选和对话历史的精准协同,实现推理效果...

Read More
2025-10-01 talkingdev

智谱AI发布GLM-4.6大模型:200K上下文窗口,宣称编程推理能力逼近Claude Sonnet 4

智谱AI正式推出新一代开源权重模型GLM-4.6,该模型最突出的特性是支持高达200K tokens的上下文窗口,使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

Read More
2025-09-30 talkingdev

Anthropic推出Claude Agent SDK:构建全能AI智能体的开发利器

人工智能公司Anthropic正式发布Claude Agent SDK,标志着其AI技术从代码生成向通用智能体构建领域的重要拓展。该开发工具包通过系统化架构设计,使开发者能够构建适用于金融管理、客户支持等复杂场景的智能体系统。...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page