Thinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...
Read More人工智能公司Anthropic正式发布Claude Agent SDK,标志着其AI技术从代码生成向通用智能体构建领域的重要拓展。该开发工具包通过系统化架构设计,使开发者能够构建适用于金融管理、客户支持等复杂场景的智能体系统。...
Read More美国加利福尼亚州州长加文·纽森于2025年9月29日正式签署SB-53法案,这项具有里程碑意义的立法将强制要求人工智能系统在生成内容时进行明确标识。该法案作为全球首个针对AI生成内容的强制性披露法规,要求开发者和部...
Read More在联合国大会上,人工智能治理成为焦点议题。尽管多国领导人和全球专家强调AI技术带来的巨大机遇与潜在风险,并呼吁建立紧急国际协作机制,但美国代表却表达了坚决反对立场。这一事件凸显了全球在AI监管路径上的深刻...
Read MoreThinking Machines公司近期发布的研究成果《模块化流形》提出了一种创新的几何框架,用于协同设计带有流形约束的神经网络优化器。该框架通过引入微分几何中的流形概念,将优化问题的约束条件自然地嵌入到神经网络训...
Read More知名开源身份认证库Auth.js(原NextAuth.js)近日宣布正式加入Better Auth团队,由后者负责其未来的维护与开发工作。这一合并标志着开源身份认证领域的重要整合,Auth.js作为Next.js生态中广泛使用的认证解决方案,...
Read MoreOpenAI近日发布了名为GDPval的创新评估基准,该基准专注于测试人工智能模型在44种不同职业领域内具有经济价值的真实任务上的性能。这一评估体系突破了传统学术基准的局限,通过模拟律师文档分析、会计师报表处理、客...
Read More最新技术分析揭示,当前流行的AI编程基准测试(如SWE-bench)实际测量范围远窄于其名称所暗示的能力。研究表明,Claude在SWE-bench获得80%评分并不等同于能一次性解决80%的实际编程任务。本文深度剖析SWE-bench Veri...
Read More