漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-22 talkingdev

Fed3DGS推出联邦学习框架,实现可扩展的3D重建

最近,Fed3DGS发布了一种基于联邦学习的3D重建框架,该框架采用3D高斯投影(3DGS)技术,能够实现在广阔区域内的去中心化场景构建。这种创新方法不仅提高了3D重建的效率和精确度,还保证了数据处理的隐私性。联邦学...

Read More
2024-03-22 talkingdev

论文:扩散状态空间模型引领图像生成新纪元

扩散状态空间模型(DiS)是一种新型的扩散模型,它采用状态空间骨干代替了传统的U-Net处理图像数据。这种模型在保持计算效率的同时,能够处理长距离依赖问题,并且能够生成高质量的图像。与传统的U-Net相比,DiS模型...

Read More
2024-03-21 talkingdev

矩阵乘法新突破,清华与伯克利联手推动理想计算

清华大学与加州大学伯克利分校的研究团队在矩阵乘法领域取得了重大突破,提出了一种创新技术,该技术已经激发了进一步的优化。这一在核心计算操作上的进步,可能在各种应用中带来显著的时间、能源和成本节省。自2010...

Read More
2024-03-21 talkingdev

JavaScript实现图像分箱算法打造像素级艺术效果

本教程介绍了如何使用JavaScript中的分箱算法,结合交互式Web元素如滑块等,创建类似像素艺术风格的图像处理工具。分箱技术通过设置箱大小和间隙等参数,通过在箱内平均像素亮度来将图像转换为风格化的、像素化的艺...

Read More
2024-03-21 talkingdev

通用一致性轨迹模型(GCTMs)助力提升图像编辑效率

近期,一项名为Generalized Consistency Trajectory Models(GCTMs)的新项目在GitHub上发布,该项目致力于通过引入一致性模型来增强扩散模型在图像编辑和恢复等任务上的能力。GCTMs通过简化处理流程,实现了通过单...

Read More
2024-03-21 talkingdev

Trigon 库:用类似 Python 的方式编写 CUDA 内核

Trigon 是一个允许开发者以类似 Python 的方式编写 CUDA 内核的库,近期正逐渐获得关注。该库的 GitHub 仓库中包含了一系列难度逐步提升的谜题,旨在鼓励开发者学习和掌握这一工具。这些谜题不仅有助于新手快速上手...

Read More
2024-03-20 talkingdev

全新数据压缩技术:AI模型训练数据集大幅缩减

近日,一项名为Poster Dataset Distillation的技术引起了广泛关注。该技术能够将庞大的数据集压缩成一个单一的'海报',使得人工智能模型能够通过不到一张每个类别的图片进行学习。这一创新方法大幅减少了训练AI模型...

Read More
2024-03-20 talkingdev

论文:Stable Diffusion 3-图像生成领域的新突破

Stable Diffusion 3(SD3)是一款具有革命性的图像生成模型,通过引入潜在对抗性扩散蒸馏技术,成功将扩散步骤数量减少至4步,同时保持了图像生成的高质量。这项技术的进步不仅提升了图像生成的效率,还为AI艺术创作...

Read More
  1. Prev Page
  2. 135
  3. 136
  4. 137
  5. Next Page