计算资源的相关内容 - 漫话开发者

2026-03-05 talkingdev

微软发布Phi-4推理视觉模型：15B参数实现多模态推理，懂得“何时思考”以提升效率

微软近日发布了Phi-4-reasoning-vision-15B，这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数，却在数学、科学、文档及用户界面（UI）推理任务上，达到了与参数量大数倍的模型相当甚至更优的性...

2026-02-26 talkingdev

近日，一项关于AI代理成本优化的技术实践引发开发者社区关注。核心观点指出，当前采用模型上下文协议（MCP）的AI代理存在显著成本问题：它们在每个会话开始时，都会将完整的工具目录以详细的JSON Schema形式加载，这...

2026-02-25 talkingdev

近日，一篇关于AI模型“智能产出比”的分析引发行业关注。该分析指出，评估AI模型性能不应仅关注其最终能解决多难的任务，更应关注模型为达到该性能水平所需的计算资源，即“智能产出比”。文章重点介绍了Anthropic公司...

2026-02-14 talkingdev

近日，开发者社区出现了一款名为CloudRouter的开源工具，它通过提供CLI和技能插件，赋予Claude Code、Codex等AI编程助手直接启动和管理云端虚拟机（VM）及GPU实例的能力。传统上，AI代理在编写代码后需在本地运行开...

2026-02-06 talkingdev

人工智能研究公司Anthropic近期公布了一项引人注目的技术实验成果：通过协调多个Claude AI智能体并行协作，成功构建了一个基于Rust语言的C语言编译器。该编译器已具备编译最新Linux 6.9内核的能力，标志着AI在复杂系...

2026-02-03 talkingdev

近日，GitHub上一个名为Shorlabs的开源项目引起了开发者社区的关注，它旨在成为后端服务领域的“Vercel”。该项目专注于简化Python和Node.js后端应用程序的部署、管理与扩展流程。其核心在于利用AWS Lambda无服务器架...

2026-01-29 talkingdev

近日，备受开发者关注的本地大语言模型运行平台LM Studio发布了其0.4.0版本更新。本次更新带来了多项关键性功能升级，核心聚焦于提升生产环境下的部署能力与推理性能。最引人注目的新特性是支持服务器部署模式，这使...

2026-01-22 talkingdev

根据The Information援引知情人士的报道，知名人工智能公司Anthropic在上个月更新了其财务预测，预计到2025年，通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...