漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-04 talkingdev

论文:使多模态大型语言模型适应各种任务

多模态大型语言模型在许多任务中表现优秀,但在定位图像中的特定对象方面往往存在困难。为了改善这一问题,研究人员已经开发出一种新的方法:将物体的位置转化为文本,并通过特殊任务进行模型的训练。这种方法的出现...

Read More
2023-10-04 talkingdev

视觉-语言模型DA-CLIP带来更优秀的图像修复效果

视觉-语言模型如CLIP在许多任务中表现出色,但在图像修复方面却面临一些挑战。因此,一项新的项目引入了DA-CLIP模型,该模型优化了CLIP的工作方式,使其更好地处理这些任务,从而带来更清晰的图像重建。DA-CLIP模型...

Read More
2023-10-04 talkingdev

稳定运行 Diffusion XL 1.0,仅需 298MB 内存

Diffusion XL 1.0 是一款高性能、低内存占用的消息传递软件,最新版本仅需 298MB 的内存即可稳定运行。该软件支持多种协议和语言,能够提供快速、可靠的数据传输服务,适用于各种场景。此外,Diffusion XL 1.0 优化...

Read More
2023-10-04 talkingdev

NPM包被缩小了

随着JavaScript项目的增长,软件开发人员越来越需要在项目中使用各种不同的JavaScript包。但是,由于这些包的数量庞大,这些软件包在下载和安装时会占用大量的时间和磁盘空间。为了解决这个问题,一个名为'Pika'的项...

Read More
2023-10-03 talkingdev

开源大模型评估套件OpenCompass:让大规模模型测试更高效

OpenCompass是一款免费的工具,旨在快速有效地测试大型模型。它的开源特性意味着任何人都可以对其进行修改和优化,以满足特定的需求。OpenCompass的核心优势在于其能够处理大规模的模型,这使得它在处理复杂的机器学...

Read More
2023-10-03 talkingdev

Cloudflare推出全球GPU网络上的无服务器AI推断平台——Workers AI

Cloudflare近日发布了一款名为“Workers AI”的无服务器人工智能推断平台,该平台运行在其全球GPU网络上。Workers AI提供了多种流行的开源模型,并与Hugging Face进行了合作。通过无服务器计算的方式,用户可以在Cloud...

Read More
2023-09-28 talkingdev

QA-LoRA的智能构建和微调方法,让LLM更快更小

大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而,一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式,使得大型语言模型能够在维持强大功能的同时,有效...

Read More
2023-09-26 talkingdev

通过被动摄像头增强深度估计的研究

这项研究提出了一种在被动摄像头中模拟主动立体感的方法,而无需使用物理图案投影仪。研究人员通过利用外部传感器的深度数据虚拟叠加图案,克服了传统设置的局限性。这种方法在各种数据集上都增强了立体算法和深度学...

Read More
  1. Prev Page
  2. 201
  3. 202
  4. 203
  5. Next Page