漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-17 talkingdev

开源|揭秘月之暗面Kimi K2如何实现万亿参数模型20秒高效RL更新

月之暗面(Moonshot AI)团队在其技术博客中详细披露了Kimi K2模型在强化学习训练领域的重大突破。该团队成功实现了对1万亿参数模型的RL参数更新仅需约20秒,这一突破性进展解决了强化学习端到端训练过程中的关键效率...

Read More
2025-08-20 talkingdev

AnduinOS:新型操作系统引发技术社区热议

技术社区近期热议的新型操作系统AnduinOS(官网:anduinos.com)在Hacker News平台引发广泛关注,获得105点赞和126条深度讨论。该项目虽未公开具体技术细节,但从社区反馈可见其可能涉及操作系统架构创新或分布式计...

Read More
2025-08-09 talkingdev

技术解析:ChatGPT如何支撑7亿周活用户?揭秘大规模AI服务的工程奇迹

OpenAI首席执行官Sam Altman近日透露,ChatGPT每周服务用户量已达7亿人次,而普通开发者甚至难以在本地单机运行一个GPT-4级别的模型。这引发了技术社区对超大规模AI服务背后工程架构的热议。专家分析指出,支撑这一...

Read More
2025-05-21 talkingdev

[论文推荐]DeepSeek-V3训练内幕:揭秘硬件-模型协同设计突破性实践

DeepSeek研究团队以DeepSeek-V3为案例,分享了大型语言模型(LLM)训练中的硬件-模型协同设计创新成果。该研究通过多头部潜在注意力机制(Multi-head Latent Attention)、专家混合系统(Mixture of Experts)、FP8...

Read More
2025-05-19 talkingdev

ParScale开源LLM扩展范式-训练与推理并行计算

人工智能领域迎来重大技术突破,开源项目ParScale通过创新性地在大型语言模型(LLM)的训练和推理阶段同时应用并行计算技术,成功建立了第三种LLM扩展范式。这一技术突破解决了传统序列计算模式在超大规模模型应用中...

Read More
2025-05-17 talkingdev

基于Node-RED的可视化低代码流编程环境开源

近日,开发者gorenje在GitHub上发布了Erlang-RED项目,这是一个受Node-RED启发的可视化低代码流编程环境,专为Erlang语言设计。该项目旨在利用Erlang的消息传递和低开销进程特性,在Node-RED流中实现真正的并发编程...

Read More
2025-05-16 talkingdev

Nous Research推出Psyche网络:利用闲置GPU资源进行分布式AI训练

Nous Research近期推出的Psyche网络是一个基于Solana区块链的分布式训练系统,该系统允许拥有兼容硬件的用户自愿贡献其GPU资源用于AI模型训练。该项目的首个计划"Consilience"旨在利用20万亿个token训练一个拥有400...

Read More
2025-05-14 talkingdev

HF推出Whisper极速转录服务,速度提升8倍

人工智能平台Hugging Face近日发布了一项突破性的语音转录服务——Whisper极速端点(Fast Whisper Endpoint)。这项创新技术通过优化模型架构和计算资源分配,实现了高达8倍的转录速度提升,为语音处理领域树立了新的...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page