人工智能公司Anthropic正式推出Claude Sonnet 4.5模型,该模型在SWE-bench Verified基准测试中以77.2%的得分刷新世界纪录,成为当前全球最卓越的代码生成模型。此次升级在计算机操作、复杂推理和数学计算三大核心领...
Read More人工智能公司Anthropic近日在npm平台正式发布了Claude Code 2.0软件包,标志着AI辅助编程工具进入新的发展阶段。该工具基于Anthropic领先的大语言模型技术,专门针对代码生成、调试和优化等开发场景进行深度优化。在...
Read More近日开发者Chris Loy在技术博客中提出警示,AI编程助手正在制造新型的技术陷阱。文章指出,传统编程过程中开发者会花费大量时间进行系统设计和逻辑推演,这些「凝视虚空」的思考阶段恰恰是构建高质量软件的关键。而...
Read MoreOpenAI近日发布了名为GDPval的创新评估基准,该基准专注于测试人工智能模型在44种不同职业领域内具有经济价值的真实任务上的性能。这一评估体系突破了传统学术基准的局限,通过模拟律师文档分析、会计师报表处理、客...
Read MoreMeta公司最新推出了名为CWM(Code World Model)的开源大语言模型,该模型参数量达320亿,采用仅解码器架构。其创新之处在于训练数据融合了代码执行轨迹与复杂推理任务,旨在构建能够理解代码动态执行过程的‘世界模...
Read More近期,GitHub上的advanced-context-engineering-for-coding-agents项目提出了一种创新方法,通过核心上下文工程原则和频繁的意图压缩,使当前AI模型能够高效处理大规模、高复杂度的代码库。传统AI在庞大代码库中难以...
Read More谷歌Chrome开发者团队近日发布了Chrome DevTools模型上下文协议(MCP)服务器的公开预览版,这一突破性技术将Chrome DevTools的强大调试能力集成到AI编程助手中。该服务器允许AI助手直接操控Chrome浏览器进行网页调...
Read MoreOpenAI宣布其新一代代码生成模型GPT-5-Codex已正式集成至Responses API服务中,同时支持通过API密钥在Codex命令行界面调用。该模型并非现有模型的直接替代品,而是经过专项优化的版本,需结合特定提示词指南以发挥最...
Read More