漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-22 talkingdev

通过扩展UNet优化稳定扩散的生成质量

稳定扩散是一种复杂的技术,其可大幅度提高生成质量,而无需进行额外的训练。这是通过巧妙地调整权重和在UNet中扩大残差来实现的。具体的代码将在不久后公布。UNet是一种广泛应用于图像分割的深度学习框架,其独特的...

Read More
2023-09-18 talkingdev

SPDTransNet开源,应用Transformers进行更深入的睡眠分析

变压器是一种智能算法,通常用于处理文本或图像。这个项目调整了它们,使其能够与EEG数据一起工作,以更好地理解睡眠阶段。变压器的这种新应用打开了一个新的可能性,即通过使用复杂的深度学习模型来解决健康问题,...

Read More
2023-09-15 talkingdev

开源新数据集助力识别伪造名人照片

DeepFakeFace (DFF) 是一个由先进技术生成的伪造名人照片的集合,旨在帮助我们更好地区分真实照片和伪造的照片。这个数据集集合了大量的伪造名人照片,这些照片的制作都运用了尖端的科技,如深度学习和人工智能等,...

Read More
2023-09-15 talkingdev

使JPEG与深度学习的优化相得益彰

JPEG图像无处不在,但由于在训练过程中无法轻松调整,所以它们与深度学习的兼容性并不好。这个项目回顾了现有的解决方案,并提出了一种新的方法,可以解决这些问题,使JPEG图像完全可调整且与深度学习系统兼容。JPEG...

Read More
2023-09-14 talkingdev

ExLlamaV2:在消费级GPU上运行本地LLMs的推理库

ExLlamaV2是一个在GitHub上开源的项目,它是为现代消费级图像处理单元(GPU)上运行本地语言模型(LLMs)而设计的推理库。这款推理库的出现,可以帮助用户在个人电脑上使用现代GPU进行深度学习模型的推理计算,而无...

Read More
2023-09-13 talkingdev

论文:人工智能获得嗅觉,准确识别气味

科研人员成功训练出一个模型,通过使用自定义的数千种手动标记分子的数据集训练图神经网络,使其能够准确地识别气味。这是人工智能在模拟人类感知能力方面的一次重大突破,标志着人工智能在感知世界的能力上迈出了新...

Read More
2023-09-11 talkingdev

在浏览器中运行现代深度学习模型——Web AI

随着技术的成熟,WebAssembly的热度逐渐降低。现在,WebAssembly已经足够好,可以在很多生产场景中使用,包括基于浏览器的模型部署。Web AI是一个GitHub仓库,它允许在浏览器中运行现代深度学习模型,这标志着WebAss...

Read More
2023-09-08 talkingdev

单一宽前馈层:转变你的编码解码器

在变压器网络中,前馈层占据了大部分的总权重。然而,如果你使用一个单一的大型前馈层,共享给编码器和解码器,你可以显著提高推理时间,同时性能的下降微乎其微。这是一种有效的优化手段,可以有效提升网络的运行效...

Read More
  1. Prev Page
  2. 33
  3. 34
  4. 35
  5. Next Page