漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-06 talkingdev

英伟达黄仁勋宣布Vera Rubin芯片全面投产:训练部分大模型所需芯片数量仅为Blackwell的四分之一

英伟达创始人兼CEO黄仁勋近日宣布,其下一代AI芯片平台Vera Rubin已进入“全面生产”阶段。根据英伟达官方披露的技术信息,Vera Rubin平台在训练特定大型语言模型时,所需芯片数量可大幅减少至当前旗舰Blackwell架构平...

Read More
2025-12-23 talkingdev

开源|CocoIndex:面向AI的超高性能数据转换框架,支持增量处理

近日,GitHub上开源了一个名为CocoIndex的数据转换框架,专为人工智能应用场景设计。该框架采用了数据流编程模型,通过提供即插即用的构建模块,显著提升了数据处理管道的开发效率与灵活性。其核心技术亮点在于保证...

Read More
2025-12-20 talkingdev

AI芯片独角兽Cerebras重启IPO进程:最快下周递交申请,目标2026年第二季度上市

据路透社援引知情人士消息,专注于人工智能训练领域的芯片制造商Cerebras Systems正计划重启其首次公开募股进程。该公司预计最快将于下周向美国证券交易委员会提交IPO申请,目标是在2026年第二季度完成上市。此举标...

Read More
2025-12-19 talkingdev

开源|History LLMs:训练于1913年前文本的“历史专家”大语言模型项目引发热议

一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...

Read More
2025-12-13 talkingdev

苹果macOS 26.2重磅更新:通过Thunderbolt实现RDMA,赋能高速AI计算集群

苹果近日在开发者文档中正式发布了macOS 26.2(代号Tahoe)的更新说明,其中一项关键特性引发了高性能计算与人工智能领域的广泛关注:系统原生支持通过Thunderbolt接口实现远程直接内存访问(RDMA)。这项技术突破意...

Read More
2025-12-05 talkingdev

Hugging Face新技能:Claude AI现已能微调开源大语言模型

Hugging Face平台近日推出了一项名为“Hugging Face Skills”的新功能,该功能赋予了Anthropic公司的Claude AI模型直接微调开源大语言模型的能力。这项技术突破意味着,用户现在可以通过Claude的对话界面,直接提交模...

Read More
2025-12-04 talkingdev

英伟达GB200 Blackwell NVL72服务器实现10倍性能飞跃,专为前沿MoE模型设计的架构突破

英伟达在混合专家模型(Mixture-of-Experts,MoE)的扩展性能方面取得了重大突破。根据官方公布的数据,其最新的GB200 Blackwell NVL72服务器配置,在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...

Read More
2025-12-03 talkingdev

Mistral AI发布Mistral 3系列开源模型:含稀疏MoE巨兽与多款密集模型

人工智能领域迎来重要开源进展。Mistral AI正式发布了其新一代Mistral 3系列模型,该系列包含两大技术路线:一是三款不同规模的密集模型(参数规模分别为140亿、80亿和30亿),二是备受瞩目的Mistral Large 3稀疏混...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page