漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-05 talkingdev

微软发布Phi-4推理视觉模型:15B参数实现多模态推理,懂得“何时思考”以提升效率

微软近日发布了Phi-4-reasoning-vision-15B,这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数,却在数学、科学、文档及用户界面(UI)推理任务上,达到了与参数量大数倍的模型相当甚至更优的性...

Read More
2026-02-26 talkingdev

一招降本94%!AI代理成本优化新思路:用CLI替代MCP实现工具懒加载

近日,一项关于AI代理成本优化的技术实践引发开发者社区关注。核心观点指出,当前采用模型上下文协议(MCP)的AI代理存在显著成本问题:它们在每个会话开始时,都会将完整的工具目录以详细的JSON Schema形式加载,这...

Read More
2026-02-25 talkingdev

Claude Opus 4.6实现“智能产出比”突破,以更少算力解决更复杂任务

近日,一篇关于AI模型“智能产出比”的分析引发行业关注。该分析指出,评估AI模型性能不应仅关注其最终能解决多难的任务,更应关注模型为达到该性能水平所需的计算资源,即“智能产出比”。文章重点介绍了Anthropic公司...

Read More
2026-02-14 talkingdev

开源|CloudRouter:让AI编程助手Claude/Codex自主调度云端VM与GPU资源

近日,开发者社区出现了一款名为CloudRouter的开源工具,它通过提供CLI和技能插件,赋予Claude Code、Codex等AI编程助手直接启动和管理云端虚拟机(VM)及GPU实例的能力。传统上,AI代理在编写代码后需在本地运行开...

Read More
2026-02-06 talkingdev

AI协作新突破:多Claude智能体并行开发出可编译Linux 6.9内核的C编译器

人工智能研究公司Anthropic近期公布了一项引人注目的技术实验成果:通过协调多个Claude AI智能体并行协作,成功构建了一个基于Rust语言的C语言编译器。该编译器已具备编译最新Linux 6.9内核的能力,标志着AI在复杂系...

Read More
2026-02-03 talkingdev

开源|Shorlabs:号称“后端Vercel”,简化Python/Node.js应用部署与扩展

近日,GitHub上一个名为Shorlabs的开源项目引起了开发者社区的关注,它旨在成为后端服务领域的“Vercel”。该项目专注于简化Python和Node.js后端应用程序的部署、管理与扩展流程。其核心在于利用AWS Lambda无服务器架...

Read More
2026-01-29 talkingdev

LM Studio 0.4.0发布:支持服务器部署与连续批处理并行请求,大幅提升本地大模型推理效率

近日,备受开发者关注的本地大语言模型运行平台LM Studio发布了其0.4.0版本更新。本次更新带来了多项关键性功能升级,核心聚焦于提升生产环境下的部署能力与推理性能。最引人注目的新特性是支持服务器部署模式,这使...

Read More
2026-01-22 talkingdev

AI成本压力显现:Anthropic大幅下调2025年毛利率预期至40%,因推理成本飙升

根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page