AI的相关内容 - 漫话开发者

2026-02-04 talkingdev

开源|GLM-OCR：集成CogViT与GLM-0.5B的多模态文档理解模型发布

近日，由zai-org团队在Hugging Face平台开源了GLM-OCR模型，这是一款专为复杂文档理解设计的先进多模态OCR系统。该模型的核心创新在于其精巧的三段式架构：首先，它采用了在大规模图文数据上预训练的CogViT视觉编码...

2026-02-04 talkingdev

近日，一项名为SWE-Universe的研究提出了一种革命性的可扩展框架，旨在从GitHub的拉取请求中自动构建真实世界的软件工程可验证环境。该研究成功解决了自动化构建中长期存在的三大挑战：构建成功率低、验证机制薄弱以...

2026-02-04 talkingdev

近日，Hugging Face发布深度博文，系统回顾了自“DeepSeek时刻”以来全球开源人工智能生态的发展轨迹。文章指出，以DeepSeek为代表的开源模型发布事件，标志着AI发展进入了一个由开放协作驱动的新阶段。该文深入剖析了...

2026-02-03 talkingdev

Cloudflare近日在GitHub上开源了一个名为Moltworker的实验性项目，该项目旨在将个人AI助手OpenClaw（曾用名Moltbot、Clawdbot）部署于其边缘计算平台Cloudflare Workers的沙箱环境中运行。这一举措标志着AI应用正加...

2026-02-03 talkingdev

OpenAI近期发布的Codex CLI是一款跨平台的本地软件代理，其核心机制——代理循环（agent loop）——代表了当前AI代理技术的前沿方向。该循环系统性地编排了用户、大语言模型与各类工具之间的交互流程：它首先迭代式地构...

2026-02-03 talkingdev

一项最新研究显示，通过对开源大语言模型进行高效的微调，其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法，仅使用5400对偏好数据对GPT-OSS 120B模型进行训练，使其在RewardBench 2评估基准的人类偏好...

2026-02-03 talkingdev

近期备受关注的Clawdbot安全事件揭示了一个关键问题：如同电子商务在早期发展中所经历的阵痛，当前方兴未艾的AI智能体（Agents）技术同样面临着严峻的安全基础设施缺失挑战。电子商务的普及依赖于一套成熟的分层安全...

2026-02-02 talkingdev

近日，GitHub上开源了一个名为Dash的自学习数据代理项目，其设计灵感来源于OpenAI的内部实现。该项目旨在解决原始大型语言模型在生成SQL时普遍存在的痛点，例如因上下文缺失、缺乏团队内部知识（Tribal Knowledge）...