工程的相关内容 - 漫话开发者

2025-05-24 talkingdev

大语言模型作为决策法官不可靠：集体智慧项目揭示隐藏偏见

集体智慧项目（CIP）最新研究指出，当大语言模型（LLM）被应用于敏感领域的决策判断时，即便采用常见的提示工程方法，其裁决仍表现出不可预测的隐藏测量偏差，导致结果不可靠。研究发现，位置偏好、顺序效应和提示敏...

2025-05-23 talkingdev

近日，一篇关于构建基于大语言模型（LLM）的智能体系统的实践框架引发业内关注。该框架提出以评估为核心的开发方法论（Evaluation-centric Development），为AI智能体的研发提供了系统性指导。文章深入探讨了如何通...

2025-05-23 talkingdev

OpenAI宣布与阿联酋科技集团G42等合作伙伴共同在阿布扎比建设超大规模人工智能数据中心Stargate UAE。该设施设计容量达1吉瓦，建成后将成为全球算力最强的AI基础设施之一。作为阿联酋国家AI战略的核心项目，首期200...

2025-05-21 talkingdev

Klavis AI近日发布了一项突破性的生产级MCP（模型计算平台）集成解决方案，该方案通过GitHub开源仓库向开发者开放。这一技术显著降低了AI应用与MCP服务器的整合门槛，提供稳定连接、内置身份验证机制及多客户端支持...

2025-05-21 talkingdev

谷歌高被引研究员Kevin Murphy近期更新了其200页的强化学习权威教材，系统性地覆盖了从传统方法到直接偏好优化（DPO）、广义策略优化（GPRO）以及推理技术等最前沿进展。该教材作为领域内的标杆性文献，不仅整合了经...

2025-05-21 talkingdev

本文探讨了软件工程领域的一个核心问题：为何优秀的工程师特质同样适用于构建高效的工程团队。作者指出，尽管大多数软件开发者自称为工程师，但他们的学术背景往往是计算机科学而非传统工程学科。这种差异引发了关于...

2025-05-20 talkingdev

GitHub最新开源项目展示了一种针对Qwen2.5B大语言模型的创新微调方案，该方案采用SFT（监督微调）结合GRPO（梯度反向传播优化）的混合训练框架，其技术路线受到DeepSeek R1架构启发，并针对AWS云平台进行了专项优化...

2025-05-19 talkingdev

OpenAI近日正式发布了名为Codex的自主编程代理系统，该系统能够在隔离的云环境中独立完成功能开发、缺陷修复以及提交拉取请求等全流程编码任务。据官方介绍，包括思科和Temporal在内的多家科技企业已开始部署该技术...