"深度学习"的相关内容 - 漫话开发者

2025-04-07 talkingdev

[开源] CrystalFormer：基于空间群对称性的晶体结构生成模型

近期，GitHub上开源了一个名为CrystalFormer的Transformer模型，该模型利用空间群对称性生成晶体结构，显著提高了晶体生成的效率和数据友好性。晶体结构在材料科学、化学和物理学等领域具有重要应用，传统方法通常依...

2025-04-04 talkingdev

Nebius近日开源了Kvax项目，这是一个基于JAX框架的Flash Attention实现，专门针对长上下文训练场景进行了优化。Kvax通过创新的上下文并行技术和高效的文档掩码计算，实现了更快的训练速度和更高的数据密度压缩，在性...

2025-04-03 talkingdev

Geometry Crafter 是一种前沿的几何估计模型，它创新性地利用视频扩散作为先验信息，实现了时间维度上的一致性几何估计。该技术能够以约1.5帧/秒的速度完成完整点云估计，同时具备精确的相机姿态估计能力。这一突破...

2025-04-03 talkingdev

近期发表在arXiv上的研究论文提出了一种名为CellVTA的创新方法，该方法通过引入基于CNN的适配器模块，将高分辨率空间特征注入到基于视觉Transformer的模型中，显著提升了细胞实例分割的精度。这一技术突破在多个基准...

2025-03-25 talkingdev

随着深度学习技术的迅猛发展，其在医学影像处理领域的应用也日益广泛。最近，一个名为“Awesome MRI Reconstruction”的开源项目在GitHub上引起了广泛关注。该项目精心收集了大量关于深度学习在磁共振成像（MRI）重建...

2025-03-24 talkingdev

近日，GitHub上发布了一个名为LHM（Large Animatable Human Reconstruction Model）的开源项目，该项目展示了如何通过单张图像快速生成一个完全可动画的3D人体模型。这一技术突破不仅展示了计算机视觉领域的重大进展...

2025-03-19 talkingdev

近日，一项名为Niagara的创新框架在3D场景重建领域取得了重要进展。该框架通过从单张图像中重建户外3D场景，结合深度和法线估计，以及几何仿射场和3D高斯解码技术，显著提升了重建的精确度和效率。这一技术不仅解决...

2025-03-17 talkingdev

Transformer模型在自然语言处理和其他领域取得了显著的成功，而其核心之一是层归一化（Layer Normalization）。然而，最新的研究提出了一种替代方案：通过精心设计的tanh函数，可以在不依赖层归一化的情况下保持模型...