科学的相关内容 - 漫话开发者

2026-04-01 talkingdev

开源|GitHub Copilot研究员实践：以智能体驱动开发，三天构建11个代理与近3万行代码

一位GitHub Copilot应用科学领域的研究人员，在构建了一个利用编码智能体分析海量智能体轨迹数据的工具后，总结并提炼出一套“智能体驱动开发”框架。该框架的核心洞见在于，将编码智能体视为初级工程师进行协作：提供...

2026-03-24 talkingdev

人工智能研究机构Epoch近日发布报告，确认其最新模型GPT-5.4 Pro成功解决了一个长期悬而未决的前沿数学开放问题——超图上的拉姆齐风格问题。该问题属于组合数学的核心领域，要求构造尽可能大的超图，使其不具备某个易...

2026-03-23 talkingdev

OpenAI宣布了一项雄心勃勃的新研究目标：构建一个完全基于智能体的自动化AI研究员。据公司首席科学家雅各布·帕乔基透露，这一目标将成为未来几年的“北极星”方向。该AI研究员旨在独立处理大规模、复杂的科研问题，标...

2026-03-17 talkingdev

在GTC 2026技术大会的预告中，NVIDIA勾勒了一幅宏大的AI技术发展蓝图，宣布将全面扩展其人工智能技术栈。该计划的核心在于构建一个跨越多个关键领域的综合性AI生态系统。具体而言，NVIDIA将深化与各方的合作，共同推...

2026-03-13 talkingdev

近日，GitHub上开源了一款名为Rudel的分析工具，专门用于对Anthropic公司推出的Claude Code编程会话进行深度数据洞察。该工具构建了一个功能全面的分析仪表盘，能够从多个维度解析开发者与AI编程助手的交互过程。其...

2026-03-13 talkingdev

AI代码助手Cursor近日公开了其核心的模型质量评估方法论，采用线上线下混合评估流程，旨在确保其对模型性能的理解与开发者的实际工作体验紧密对齐。该体系的核心在于其内部评估套件CursorBench，它基于Cursor工程团...

2026-03-06 talkingdev

人工智能安全与研究公司Anthropic近期发布了一项重要研究，提出了一种全新的框架，旨在系统性地理解和衡量AI技术对劳动力市场的实际影响。该研究的目标是建立一个可重复、可验证的测量方法，以追踪AI如何具体影响就...

2026-03-06 talkingdev

OpenAI近日发布了一份具有战略指导意义的框架，系统性地阐述了企业如何利用人工智能技术创造价值并驱动业务重塑，而非仅仅停留在零散的试点项目上。该框架的核心在于提出了五种AI价值创造模型，为企业领导者规划了一...