漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-03 talkingdev

IBM发布开源企业级大模型Granite 4.0:混合架构显著降低内存占用

科技巨头IBM近日正式推出Granite 4.0大语言模型系列,该开源方案采用创新的混合架构设计,宣称相比传统LLM可大幅降低内存占用。作为拥有114年历史的科技企业,IBM此次发布的模型特别强调“企业就绪”特性,通过结合Mam...

Read More
2025-10-02 talkingdev

Blockdiff:Cognition AI自研虚拟机磁盘快照文件格式,实现零开销瞬时快照

人工智能公司Cognition AI为解决其AI软件工程师Devin在EC2环境中遇到的虚拟机磁盘快照速度瓶颈,自主研发了开源工具Blockdiff。该工具通过创新性地采用仅存储基础镜像与虚拟机磁盘间差异块的机制,成功构建出紧凑型...

Read More
2025-10-02 talkingdev

谷歌发布Tunix:基于JAX的LLM后训练工具库,加速大模型生产部署

谷歌开发者博客最新推出开源项目Tunix,这是一个基于JAX框架原生设计的专业化工具库,致力于简化大型语言模型从预训练到完全对齐、生产就绪的完整流程。该库为开发者提供了一套全面且友好的工具集,支持大规模模型对...

Read More
2025-10-02 talkingdev

Thinking Machines实验室推出Tinker API:革新语言模型微调技术

Thinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...

Read More
2025-10-01 talkingdev

开源|你可能不需要useEffect:ESLint插件助力React代码优化

近日,GitHub上线了一款名为eslint-plugin-react-you-might-not-need-an-effect的开源工具,专门用于检测React项目中不必要的useEffect钩子使用。该插件通过静态代码分析技术,能够精准识别出三类常见滥用场景:基于...

Read More
2025-10-01 talkingdev

Anthropic提出AI代理上下文工程新范式:突破有限上下文窗口的智能管理策略

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战,提出通过系统指令、工具配置、数据筛选和对话历史的精准协同,实现推理效果...

Read More
2025-09-30 talkingdev

DeepSeek-V3.2-Exp发布:稀疏注意力机制突破长序列处理瓶颈

深度求索公司最新推出的DeepSeek-V3.2-Exp模型引入了创新的稀疏注意力机制,这一技术突破专门针对长上下文序列的训练和推理效率进行了深度优化。该机制通过智能选择关键注意力区域,显著降低了计算复杂度,使得模型...

Read More
2025-09-30 talkingdev

Anthropic推出Claude Agent SDK:构建全能AI智能体的开发利器

人工智能公司Anthropic正式发布Claude Agent SDK,标志着其AI技术从代码生成向通用智能体构建领域的重要拓展。该开发工具包通过系统化架构设计,使开发者能够构建适用于金融管理、客户支持等复杂场景的智能体系统。...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page