漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-27 talkingdev

开源|SWE-Pruner:代码智能体上下文剪枝框架,令牌消耗锐减超50%

近日,GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架,旨在显著优化代码智能体(Coding Agents)在处理复杂软件工程任务时的效率与成本。该框架的核心在于,通过一个轻量级模型动态分析与...

Read More
2026-01-23 talkingdev

小模型大作为:谷歌提出分解法,实现更优意图理解,兼顾效率与隐私

谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出,要让AI智能体真正发挥作用,其底层模型必须精准理解用户交互时的真实意图。当前,大型多模态大语言模型虽已在此任务上表现不俗,但...

Read More
2026-01-22 talkingdev

AI成本压力显现:Anthropic大幅下调2025年毛利率预期至40%,因推理成本飙升

根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...

Read More
2026-01-07 talkingdev

开源|Mantic:专为AI代理设计的结构代码搜索引擎,本地运行,无需嵌入模型

近日,GitHub上开源了一个名为Mantic的结构代码搜索引擎项目,专为AI代理(AI Agents)设计。该项目旨在解决AI代理在处理大规模代码库时面临的效率与成本问题。Mantic的核心创新在于,它不依赖于传统的嵌入模型或外...

Read More
2025-12-04 talkingdev

英伟达GB200 Blackwell NVL72服务器实现10倍性能飞跃,专为前沿MoE模型设计的架构突破

英伟达在混合专家模型(Mixture-of-Experts,MoE)的扩展性能方面取得了重大突破。根据官方公布的数据,其最新的GB200 Blackwell NVL72服务器配置,在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...

Read More
2025-12-03 talkingdev

亚马逊发布第三代AI训练芯片Trainium3,性能大幅提升并展示兼容英伟达路线图

亚马逊云科技(AWS)在自研AI芯片领域持续发力,近日正式发布了其第三代AI训练专用芯片——Trainium3。这款芯片在性能规格上表现亮眼,标志着AWS在降低AI计算成本、提供多元化算力解决方案方面迈出了重要一步。值得注...

Read More
2025-12-01 talkingdev

技术解析:Prompt缓存如何工作?深度剖析vLLM的Paged Attention与自动前缀缓存机制

在大型语言模型推理优化领域,Prompt缓存技术正成为提升服务效率、降低计算成本的关键前沿技术。本文深入解析了Prompt缓存的核心工作原理,特别聚焦于vLLM框架中创新的Paged Attention机制及其实现的自动前缀缓存。...

Read More
2025-11-05 talkingdev

100x将FFmpeg嵌入浏览器代理:实现无服务器视频处理

科技公司100x近期实现了一项技术突破,通过将FFmpeg多媒体处理工具直接集成到Chrome扩展的浏览器代理中,使得复杂媒体处理流程彻底摆脱了对服务器、API或文件上传的依赖。这一创新将FFmpeg转化为浏览器代理的标准化...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page