漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-07 talkingdev

[开源] CrystalFormer:基于空间群对称性的晶体结构生成模型

近期,GitHub上开源了一个名为CrystalFormer的Transformer模型,该模型利用空间群对称性生成晶体结构,显著提高了晶体生成的效率和数据友好性。晶体结构在材料科学、化学和物理学等领域具有重要应用,传统方法通常依...

Read More
2025-04-04 talkingdev

[开源]Nebius推出Kvax:基于JAX的Flash Attention优化实现,助力长上下文训练

Nebius近日开源了Kvax项目,这是一个基于JAX框架的Flash Attention实现,专门针对长上下文训练场景进行了优化。Kvax通过创新的上下文并行技术和高效的文档掩码计算,实现了更快的训练速度和更高的数据密度压缩,在性...

Read More
2025-04-03 talkingdev

Geometry Crafter:基于视频扩散模型的动态几何一致性估计技术

Geometry Crafter 是一种前沿的几何估计模型,它创新性地利用视频扩散作为先验信息,实现了时间维度上的一致性几何估计。该技术能够以约1.5帧/秒的速度完成完整点云估计,同时具备精确的相机姿态估计能力。这一突破...

Read More
2025-04-03 talkingdev

[论文推荐]CellVTA通过CNN适配器增强视觉Transformer的细胞实例分割性能

近期发表在arXiv上的研究论文提出了一种名为CellVTA的创新方法,该方法通过引入基于CNN的适配器模块,将高分辨率空间特征注入到基于视觉Transformer的模型中,显著提升了细胞实例分割的精度。这一技术突破在多个基准...

Read More
2025-03-25 talkingdev

[开源] Awesome MRI Reconstruction:深度学习在MRI重建中的前沿应用

随着深度学习技术的迅猛发展,其在医学影像处理领域的应用也日益广泛。最近,一个名为“Awesome MRI Reconstruction”的开源项目在GitHub上引起了广泛关注。该项目精心收集了大量关于深度学习在磁共振成像(MRI)重建...

Read More
2025-03-24 talkingdev

[开源]LHM模型:单张图像秒速生成可动画的3D人体模型

近日,GitHub上发布了一个名为LHM(Large Animatable Human Reconstruction Model)的开源项目,该项目展示了如何通过单张图像快速生成一个完全可动画的3D人体模型。这一技术突破不仅展示了计算机视觉领域的重大进展...

Read More
2025-03-19 talkingdev

Niagara推出单视图3D场景重建新框架

近日,一项名为Niagara的创新框架在3D场景重建领域取得了重要进展。该框架通过从单张图像中重建户外3D场景,结合深度和法线估计,以及几何仿射场和3D高斯解码技术,显著提升了重建的精确度和效率。这一技术不仅解决...

Read More
2025-03-17 talkingdev

[论文推荐] 无需归一化的Transformer模型

Transformer模型在自然语言处理和其他领域取得了显著的成功,而其核心之一是层归一化(Layer Normalization)。然而,最新的研究提出了一种替代方案:通过精心设计的tanh函数,可以在不依赖层归一化的情况下保持模型...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page