漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-24 talkingdev

首个基于Muon优化器训练的大规模模型Moonlight 16B发布

近日,首个基于Muon优化器训练的大规模模型Moonlight 16B在GitHub上正式发布。该模型经过5.7万亿个token的训练,架构与DeepSeek v3高度相似。Muon优化器的引入为大规模模型的训练提供了新的可能性,显著提升了训练效...

Read More
2025-02-21 talkingdev

Google Titans模型解析:内存驱动AI架构的未来

Google Titans模型是Google最新推出的一种内存驱动AI架构,旨在通过高效的内存管理和数据处理能力,提升AI模型的性能和效率。该模型的核心在于其独特的内存驱动设计,能够显著减少数据访问延迟,从而加速模型训练和...

Read More
2025-02-19 talkingdev

DeepSeek推出Native Sparse Attention技术,显著提升Attention计算效率

近日,DeepSeek公司推出了一项名为Native Sparse Attention的创新算法技术,旨在加速传统的二次Attention计算。该技术通过硬件对齐和原生可训练的稀疏Attention机制,实现了高达11倍的计算速度提升,同时保持了整体...

Read More
2025-02-13 talkingdev

OpenAI公布GPT-5路线图:GPT-4.5将成最后非链式思维模型

OpenAI近日公布了其GPT系列模型的未来发展路线图,计划在推出GPT-5之前,先发布GPT-4.5作为最后一个非链式思维(non-chain-of-thought)模型。GPT-5将实现o-series与GPT-series模型的统一,标志着OpenAI在大型语言模...

Read More
2025-02-11 talkingdev

A0.dev推出React Native应用生成器,助力开发者快速构建跨平台应用

近日,A0.dev(YC W25)正式发布了其React Native应用生成器,旨在帮助开发者更高效地构建跨平台移动应用。该工具通过自动化生成React Native代码,显著减少了开发时间和复杂性。A0.dev的生成器支持多种自定义选项,...

Read More
2025-02-10 talkingdev

从React前端转向Go与WebAssembly的技术革新

在最新的技术转型中,一家领先的科技公司决定将其前端技术栈从React迁移至Go与WebAssembly的组合。这一决策不仅标志着技术架构的重大变革,也展示了WebAssembly在现代Web开发中的潜力。通过使用Go语言编写业务逻辑,...

Read More
2025-02-08 talkingdev

Framework Laptop 13推出RISC-V主板,开启模块化新篇章

近日,Framework Laptop 13正式推出了支持RISC-V架构的主板,这一创新举措标志着模块化笔记本电脑领域迈出了重要一步。RISC-V作为一种开源指令集架构,以其灵活性和可定制性著称,此次与Framework Laptop 13的结合,...

Read More
2025-01-31 talkingdev

Zusie——我的继电器计算机

Zusie是一款基于继电器技术的计算机,由个人开发者独立设计和制造。这款计算机不仅展示了继电器在计算领域的潜力,还体现了DIY精神的极致追求。Zusie的设计灵感来源于早期的计算机架构,通过继电器实现逻辑运算和数...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page