深度学习的相关内容 - 漫话开发者

2026-07-20 talkingdev

Sakana AI“扩散归咎”方法：无需权重传输即可实现符合Dale原则的生物可塑性学习

Sakana AI 提出了一项名为“Diffusing Blame”（扩散归咎）的神经网络学习新技术，其核心创新在于严格遵循神经科学中的戴尔原则（Dale's principle），即每个神经元只释放一种类型的神经递质，或兴奋或抑制，绝不混合...

2026-06-12 talkingdev

本文深入探讨了PyTorch在执行和优化神经网络层方面的最新进展，特别是从单个线性操作逐步过渡到融合多层感知机（MLP）的过程。文章详细剖析了如何通过算子融合技术，将多个连续的线性变换和激活函数合并为一个计算核...

2026-06-12 talkingdev

近日，一位独立开发者分享了一项极具工程教育意义的项目：从零开始构建一个“复古风格”的大语言模型（LLM）。项目不仅涵盖了基础训练与微调脚本的自主编写，还包括完整的数据处理管线以及定制数据集的构建。令人瞩目...

2026-05-18 talkingdev

在计算机辅助设计（CAD）领域，生成式人工智能正展现出颠覆传统工作流的潜力。GenCAD项目正是这一趋势的典型代表。该项目旨在利用生成模型，直接根据用户的自然语言描述或简单草图，自动生成精确且可编辑的设计文件...

2026-04-25 talkingdev

一篇发表于arXiv上的新论文《There Will Be a Scientific Theory of Deep Learning》正引发人工智能学术界的广泛讨论。该文阐述了深度学习虽在实践中取得空前成功，但其理论基础仍相对薄弱，核心机制尚未被完全揭示...

2026-04-16 talkingdev

谷歌近日在GitHub上开源了其内部广泛使用的AI文件类型检测工具——Magika。该项目采用了一个经过专门优化的轻量级深度学习模型，能够在毫秒级别内对超过200种文件内容类型进行快速且高精度的识别。与传统的基于文件扩...

2026-04-05 talkingdev

近日，AI领域知名专家、OpenAI联合创始人安德烈·卡帕西（Andrej Karpathy）在社交媒体上分享了一个名为“LLM Wiki”的GitHub Gist项目，并将其描述为一个“灵感文件”（idea file）的范例。该项目迅速在技术社区引发关注...

2026-03-22 talkingdev

近日，一个名为Tinybox的离线AI设备项目在技术社区引发了广泛关注。该项目旨在打造一款能够本地离线运行高达1200亿参数大型语言模型的紧凑型硬件设备。这一构想直击当前AI应用的核心痛点：数据隐私、网络依赖和高昂...