漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-12 talkingdev

PyTorch性能优化新突破:从nn.Linear到融合MLP的深度剖析

本文深入探讨了PyTorch在执行和优化神经网络层方面的最新进展,特别是从单个线性操作逐步过渡到融合多层感知机(MLP)的过程。文章详细剖析了如何通过算子融合技术,将多个连续的线性变换和激活函数合并为一个计算核...

Read More
2026-04-25 talkingdev

论文推荐|深度学习将拥有科学理论:一篇纲领性论文引发热议

一篇发表于arXiv上的新论文《There Will Be a Scientific Theory of Deep Learning》正引发人工智能学术界的广泛讨论。该文阐述了深度学习虽在实践中取得空前成功,但其理论基础仍相对薄弱,核心机制尚未被完全揭示...

Read More
2026-04-21 talkingdev

开源|Soul Player C64:在1MHz的Commodore 64上运行的真实Transformer模型

近日,GitHub上一个名为‘soulplayer-c64’的开源项目引发了技术社区的广泛关注。该项目成功地在仅有1MHz主频、内存极其有限的经典计算机Commodore 64上,部署并运行了一个拥有25,000个参数的真实Transformer神经网络...

Read More
2026-03-16 talkingdev

注意力残差:重新思考深度聚合,Moonshot AI提出新架构提升模型性能

在深度学习领域,残差连接(Residual Connections)是构建深层神经网络的关键技术,它通过将浅层特征直接传递到深层,有效缓解了梯度消失问题。然而,传统的残差连接通常采用固定、均匀的累加方式,这可能限制了模型...

Read More
2026-02-11 talkingdev

开源|Rowboat:将工作流转化为知识图谱的AI协作者,本地优先、支持MCP协议

Rowboat是一款开源、本地优先的AI协作者应用,其核心创新在于将用户的工作内容动态转化为可生长的知识图谱,并基于此图谱执行实际任务。该系统由两大模块构成:一是“活上下文图谱”,通过连接Gmail、Granola、Firefli...

Read More
2026-01-20 talkingdev

开源|Meta发布ShapeR:从图像序列生成完整3D场景网格

Meta AI研究院近日在GitHub开源了ShapeR项目,该项目代表了3D场景重建领域的一项重要进展。ShapeR的核心技术在于能够仅从一系列图像中,重建出完整的、高质量的三维场景网格。其技术路径颇具创新性:首先,系统从输...

Read More
2025-12-23 talkingdev

图解Transformer经典:让复杂架构一目了然

一篇题为《图解Transformer》的技术博客在开发者社区Hacker News上引发了广泛关注,该博客由jalammar撰写,通过大量直观的图示和清晰的解释,深入浅出地剖析了Transformer这一革命性神经网络架构的核心工作原理。Tra...

Read More
2025-11-24 talkingdev

揭秘大语言模型推理机制:从输入到输出的技术全流程

大语言模型(LLM)作为基于Transformer架构的神经网络,通过并行分析完整序列并计算词语间的全局关联性,实现了自然语言处理的突破性进展。在推理过程中,模型首先将输入文本转化为数字化的词元嵌入向量,随后通过Tr...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page