大语言模型的相关内容 - 漫话开发者

2026-02-09 talkingdev

开源|GitHub推出Agentic Workflows：用自然语言定义AI驱动的代码库自动化

GitHub近日正式推出Agentic Workflows，这是一项旨在深度集成于GitHub Actions平台、通过AI编码代理实现代码库自动化管理的前沿功能。用户无需编写复杂的YAML脚本，仅需使用Markdown文件以自然语言描述期望的自动化...

2026-02-06 talkingdev

人工智能研究公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大语言模型在专业应用领域的能力边界再次被拓展。该模型在智能体编码、计算机使用、工具调用、信息检索及金...

2026-02-06 talkingdev

人工智能公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大模型在智能体能力、任务持久性和复杂场景应用上取得了显著进步。该模型在智能体编码、计算机使用、工具调用、...

2026-02-04 talkingdev

Deno公司近日正式推出Deno Sandbox平台，这是一项专为安全执行不可信代码设计的前沿基础设施服务，尤其针对当前大语言模型（LLM）生成代码的安全运行难题提供了创新解决方案。该平台的核心技术在于采用轻量级Linux微...

2026-02-03 talkingdev

OpenAI近期发布的Codex CLI是一款跨平台的本地软件代理，其核心机制——代理循环（agent loop）——代表了当前AI代理技术的前沿方向。该循环系统性地编排了用户、大语言模型与各类工具之间的交互流程：它首先迭代式地构...

2026-02-03 talkingdev

近日，NVIDIA研究团队提出了一种名为“金鹅”（Golden Goose）的创新方法，旨在解决大语言模型（LLM）强化学习领域的一个关键瓶颈。当前，基于可验证奖励的强化学习（RLVR）是解锁LLM复杂推理能力的重要基石，但其发展...

2026-02-03 talkingdev

一项最新研究显示，通过对开源大语言模型进行高效的微调，其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法，仅使用5400对偏好数据对GPT-OSS 120B模型进行训练，使其在RewardBench 2评估基准的人类偏好...

2026-01-31 talkingdev

近日，国内人工智能公司月之暗面（Moonshot AI）在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开，迅速吸引了全球开发者与AI研究者的高度关注，在知名技术社区Hacker News上获得...