集体智慧项目(CIP)最新研究指出,当大语言模型(LLM)被应用于敏感领域的决策判断时,即便采用常见的提示工程方法,其裁决仍表现出不可预测的隐藏测量偏差,导致结果不可靠。研究发现,位置偏好、顺序效应和提示敏...
Read More近日,一篇关于构建基于大语言模型(LLM)的智能体系统的实践框架引发业内关注。该框架提出以评估为核心的开发方法论(Evaluation-centric Development),为AI智能体的研发提供了系统性指导。文章深入探讨了如何通...
Read MoreOpenAI宣布与阿联酋科技集团G42等合作伙伴共同在阿布扎比建设超大规模人工智能数据中心Stargate UAE。该设施设计容量达1吉瓦,建成后将成为全球算力最强的AI基础设施之一。作为阿联酋国家AI战略的核心项目,首期200...
Read MoreKlavis AI近日发布了一项突破性的生产级MCP(模型计算平台)集成解决方案,该方案通过GitHub开源仓库向开发者开放。这一技术显著降低了AI应用与MCP服务器的整合门槛,提供稳定连接、内置身份验证机制及多客户端支持...
Read More谷歌高被引研究员Kevin Murphy近期更新了其200页的强化学习权威教材,系统性地覆盖了从传统方法到直接偏好优化(DPO)、广义策略优化(GPRO)以及推理技术等最前沿进展。该教材作为领域内的标杆性文献,不仅整合了经...
Read More本文探讨了软件工程领域的一个核心问题:为何优秀的工程师特质同样适用于构建高效的工程团队。作者指出,尽管大多数软件开发者自称为工程师,但他们的学术背景往往是计算机科学而非传统工程学科。这种差异引发了关于...
Read MoreGitHub最新开源项目展示了一种针对Qwen2.5B大语言模型的创新微调方案,该方案采用SFT(监督微调)结合GRPO(梯度反向传播优化)的混合训练框架,其技术路线受到DeepSeek R1架构启发,并针对AWS云平台进行了专项优化...
Read MoreOpenAI近日正式发布了名为Codex的自主编程代理系统,该系统能够在隔离的云环境中独立完成功能开发、缺陷修复以及提交拉取请求等全流程编码任务。据官方介绍,包括思科和Temporal在内的多家科技企业已开始部署该技术...
Read More