漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-25 talkingdev

论文推荐|深度学习将拥有科学理论:一篇纲领性论文引发热议

一篇发表于arXiv上的新论文《There Will Be a Scientific Theory of Deep Learning》正引发人工智能学术界的广泛讨论。该文阐述了深度学习虽在实践中取得空前成功,但其理论基础仍相对薄弱,核心机制尚未被完全揭示...

Read More
2026-04-21 talkingdev

开源|Soul Player C64:在1MHz的Commodore 64上运行的真实Transformer模型

近日,GitHub上一个名为‘soulplayer-c64’的开源项目引发了技术社区的广泛关注。该项目成功地在仅有1MHz主频、内存极其有限的经典计算机Commodore 64上,部署并运行了一个拥有25,000个参数的真实Transformer神经网络...

Read More
2026-03-16 talkingdev

注意力残差:重新思考深度聚合,Moonshot AI提出新架构提升模型性能

在深度学习领域,残差连接(Residual Connections)是构建深层神经网络的关键技术,它通过将浅层特征直接传递到深层,有效缓解了梯度消失问题。然而,传统的残差连接通常采用固定、均匀的累加方式,这可能限制了模型...

Read More
2026-02-11 talkingdev

开源|Rowboat:将工作流转化为知识图谱的AI协作者,本地优先、支持MCP协议

Rowboat是一款开源、本地优先的AI协作者应用,其核心创新在于将用户的工作内容动态转化为可生长的知识图谱,并基于此图谱执行实际任务。该系统由两大模块构成:一是“活上下文图谱”,通过连接Gmail、Granola、Firefli...

Read More
2026-01-20 talkingdev

开源|Meta发布ShapeR:从图像序列生成完整3D场景网格

Meta AI研究院近日在GitHub开源了ShapeR项目,该项目代表了3D场景重建领域的一项重要进展。ShapeR的核心技术在于能够仅从一系列图像中,重建出完整的、高质量的三维场景网格。其技术路径颇具创新性:首先,系统从输...

Read More
2025-12-23 talkingdev

图解Transformer经典:让复杂架构一目了然

一篇题为《图解Transformer》的技术博客在开发者社区Hacker News上引发了广泛关注,该博客由jalammar撰写,通过大量直观的图示和清晰的解释,深入浅出地剖析了Transformer这一革命性神经网络架构的核心工作原理。Tra...

Read More
2025-11-24 talkingdev

揭秘大语言模型推理机制:从输入到输出的技术全流程

大语言模型(LLM)作为基于Transformer架构的神经网络,通过并行分析完整序列并计算词语间的全局关联性,实现了自然语言处理的突破性进展。在推理过程中,模型首先将输入文本转化为数字化的词元嵌入向量,随后通过Tr...

Read More
2025-11-20 talkingdev

开源|PyTorch生态迎来科学机器学习新成员PINA

近日,开源科学机器学习库PINA正式加入PyTorch生态系统,为科研与工程领域带来突破性工具。该库提供模块化、可扩展的工作流,专门针对偏微分方程求解器、物理系统模拟等科学计算任务进行优化。通过深度融合物理先验...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page