漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-02 talkingdev

Thinking Machines实验室推出Tinker API:革新语言模型微调技术

Thinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...

Read More
2025-09-30 talkingdev

Anthropic推出Claude Agent SDK:构建全能AI智能体的开发利器

人工智能公司Anthropic正式发布Claude Agent SDK,标志着其AI技术从代码生成向通用智能体构建领域的重要拓展。该开发工具包通过系统化架构设计,使开发者能够构建适用于金融管理、客户支持等复杂场景的智能体系统。...

Read More
2025-09-30 talkingdev

加州签署AI透明度法案,全球人工智能治理迈出关键一步

美国加利福尼亚州州长加文·纽森于2025年9月29日正式签署SB-53法案,这项具有里程碑意义的立法将强制要求人工智能系统在生成内容时进行明确标识。该法案作为全球首个针对AI生成内容的强制性披露法规,要求开发者和部...

Read More
2025-09-28 talkingdev

美国在联合国拒绝AI治理国际合作倡议,多国呼吁紧急协同应对风险

在联合国大会上,人工智能治理成为焦点议题。尽管多国领导人和全球专家强调AI技术带来的巨大机遇与潜在风险,并呼吁建立紧急国际协作机制,但美国代表却表达了坚决反对立场。这一事件凸显了全球在AI监管路径上的深刻...

Read More
2025-09-27 talkingdev

模块化流形:一种结合几何约束的神经网络优化器协同设计新框架

Thinking Machines公司近期发布的研究成果《模块化流形》提出了一种创新的几何框架,用于协同设计带有流形约束的神经网络优化器。该框架通过引入微分几何中的流形概念,将优化问题的约束条件自然地嵌入到神经网络训...

Read More
2025-09-27 talkingdev

开源|Auth.js正式并入Better Auth,身份认证生态迎来整合

知名开源身份认证库Auth.js(原NextAuth.js)近日宣布正式加入Better Auth团队,由后者负责其未来的维护与开发工作。这一合并标志着开源身份认证领域的重要整合,Auth.js作为Next.js生态中广泛使用的认证解决方案,...

Read More
2025-09-26 talkingdev

OpenAI推出GDPval:衡量AI模型在44个职业中真实任务表现的新基准

OpenAI近日发布了名为GDPval的创新评估基准,该基准专注于测试人工智能模型在44种不同职业领域内具有经济价值的真实任务上的性能。这一评估体系突破了传统学术基准的局限,通过模拟律师文档分析、会计师报表处理、客...

Read More
2025-09-26 talkingdev

AI编程基准测试真相:流行评测到底在衡量什么?

最新技术分析揭示,当前流行的AI编程基准测试(如SWE-bench)实际测量范围远窄于其名称所暗示的能力。研究表明,Claude在SWE-bench获得80%评分并不等同于能一次性解决80%的实际编程任务。本文深度剖析SWE-bench Veri...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page