GitHub最新开源项目Optimal Stepsize for Diffusion Sampling (OSS)通过动态规划算法优化了扩散模型的采样步长调度方案。这项突破性技术能在保持生成质量近乎无损的情况下,将采样速度提升10倍。该研究解决了扩散模...
Read More近日,GitHub上出现了一个名为'awesome-multimodal-adaptation'的开源项目,该项目系统性地整理了多模态自适应领域的最新研究进展。该项目不仅涵盖了传统的领域自适应方法,还包括测试时自适应等新兴技术方向。多模...
Read More近日,GitHub上开源了一个名为Mobile-VideoGPT的轻量级多模态视频模型,其参数量不足10亿(1B),却通过创新的双视觉编码器和令牌剪枝技术,实现了在边缘设备上的实时推理能力。这一突破性进展为移动端和物联网设备...
Read MoreVeloren是一款开源的体素(voxel)风格动作冒险角色扮演游戏(RPG),其灵感来源于经典游戏如《塞尔达传说》和《Cube World》。该游戏采用Rust语言开发,支持多人在线协作,玩家可以在一个广阔的开放世界中探索、战...
Read More视觉几何基础Transformer(Visual Geometry Grounded Transformer,简称VGGT)是一种前馈神经网络,能够直接从场景的一个、几个甚至数百个视角中推断出所有关键的3D属性,包括外部和内部相机参数、点云图、深度图以...
Read MoreFastCuRL-1.5B-Preview 是一种基于课程强化学习(Curriculum Reinforcement Learning)的慢思维推理模型,该模型在较少的训练步骤中实现了最先进的性能,展示了其在复杂推理任务中的潜力。相比传统方法,FastCuRL 通...
Read MoreBaichuan Omni 1.5 是一款支持文本、图像、视频和音频输入以及文本和音频输出的开源全模态基础模型。该模型采用任意到任意(any-to-any)的设计风格,属于原生多模态模型的一种典型代表。其核心技术在于使用了交错的...
Read More随着深度学习技术的迅猛发展,其在医学影像处理领域的应用也日益广泛。最近,一个名为“Awesome MRI Reconstruction”的开源项目在GitHub上引起了广泛关注。该项目精心收集了大量关于深度学习在磁共振成像(MRI)重建...
Read More