漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-12 talkingdev

Unsloth轻量化库加速TRL上的模型

Unsloth是一个轻量化库,可加速语言模型的微调。它现在可以轻松地与TRL在常见的模型架构上配合使用。Unsloth库通过一个简单的API使得模型训练和微调更快速。它可以帮助从训练数据中自动学习、优化和微调模型,使得模...

Read More
2024-01-10 talkingdev

结合CLIP和SAM以增强图像分割能力

本项目介绍了开放项目SAM,这是一个结合了CLIP和SAM模型的框架,用于提高图像分割和识别的能力。CLIP模型是一种基于对比学习的神经网络模型,用于学习图像和文字之间的关系,而SAM模型则是一种序列建模方法,用于对...

Read More
2024-01-09 talkingdev

论文:如何在不丢失信息的情况下调整模型

最新的研究表明,在语言模型中添加新的模块并在另一个任务上进行调整,可以防止丢失知识。这在代码和语言任务中都有体现。

Read More
2023-12-25 talkingdev

UDiffText-提高AI生成图片中的文字质量

UDiffText是一种全新的方法,可以提高AI生成图片中的文字质量。通过使用专门的文本编码器和大型数据集进行微调,UDiffText显著减少拼写错误并提高文字准确性

Read More
2023-12-22 talkingdev

WhisperPlus,高质量语音转文字技术开源

近日,WhisperPlus正式发布。据悉,该开源项目采用了先进的语音转文字处理技术,能够实现高质量、高准确性的语音转文字功能。此外,该项目还支持多种语言和方言,可广泛应用于语音转写、智能客服等领域。WhisperPlus...

Read More
2023-12-20 talkingdev

论文:SmooSeg,更优越的语义分割技术

本研究介绍了SmooSeg,这是一种新的方法,利用了图像中相邻特征往往共享相似含义的原则。SmooSeg的主要优点是提高了图像分割的准确性和速度。通过在训练过程中考虑相邻特征之间的关系,SmooSeg能够更好地理解图像的...

Read More
2023-12-19 talkingdev

利用扩散模型在图像中估计光照

本项目介绍了一种新的技术,用于估计图像中的光照,克服了当前依赖HDR全景数据集的现有方法的局限性。通过使用扩散模型将铬球渲染到标准图像中,该技术揭示了铬球与扩散噪声之间的独特关系。这种技术有助于提高图像...

Read More
2023-12-15 talkingdev

论文:一种高效压缩LLM模型方法

这项研究介绍了一种使用降阶建模压缩大型语言模型的方法,可以显著减少内存和时间限制,而无需高端硬件。由于大型语言模型在自然语言处理中的应用越来越广泛,因此压缩这些模型以提高计算效率变得尤为重要。研究人员...

Read More
2023-12-06 talkingdev

DMP开源,可提升AI图像预测精度

Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优...

Read More
2023-12-05 talkingdev

MaXTron,新的视频全景分割技术开源

MaXTron是一种简单而有效的统一元架构,用于视频分割。

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page