漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-22 talkingdev

腾讯开源PhotoMaker生成风格化人像

生成式图像模型最受欢迎的用途之一是个性化风格的图像生成。历史上,这需要训练LoRA或使用DreamBooth。现在,通过使用ID嵌入,您可以在仅使用单张图像的情况下大大提高质量并降低计算成本。

Read More
2024-01-22 talkingdev

小模型公司Sakana AI获得3000万美元种子轮融资

Sakana.ai正在东京建立世界级研究实验室,以建立更小、更高效的基础模型。该公司由前谷歌研究员David Ha和Llion Jones创立,他们负责转型、世界模型和LoRA等突破性技术。它已获得了来自Lux Capital的Brandon Reeves...

Read More
2024-01-09 talkingdev

对比激活下的Steering Llama 2技术

有很多方式可以对齐语言模型,例如SFT、LoRa、RLHF、DPO、Prompting和Threatening。本研究提出使用负嵌入加到偏置项中,以将模型生成推向期望的结果。

Read More
2023-11-28 talkingdev

ZipLoRA: 低秩学习矩阵合并技术提升模型性能

本文介绍了一种名为 ZipLoRA 的技术,该技术可以将多个低秩学习矩阵(LoRAs)合并在一起,从而改善模型性能。相比于常规的微调,LoRAs 更加经济实惠,但是也会改变模型的行为。本文提出的 ZipLoRA 技术可以在保留每...

Read More
2023-11-15 talkingdev

LLaMA模型的增强:引入泰米尔语令牌

经过增强的LLaMA模型现已包含16,000个泰米尔语令牌,利用了LoRA方法进行高效训练。这个更新,连同Alpaca和OpenOrca数据集的新的泰米尔语版本,显著改进了泰米尔语文本处理,为印度语言人工智能的未来发展铺平了道路...

Read More
2023-11-13 talkingdev

LongQLoRA:提升LLMs上下文理解能力

GitHub上有一个新的工具——LongQLoRA,它可以让LLMs(语言模型)理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功,但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...

Read More
2023-11-10 talkingdev

Punica:运行多个LoRA精细调整模型的利器

Punica是一个开源的Python库,旨在降低使用LoRA精细调整模型的成本。LoRA是一种用于低功耗、远距离通信的无线电调制技术。在使用LoRA进行通信时,需要对模型进行精细调整以获得最佳性能。Punica可以同时运行多个精细...

Read More
2023-10-20 talkingdev

Hugging Face Space推出万圣节LoRA照相亭

Hugging Face Space推出了一款万圣节LoRA照相亭,用户可以通过使用Stable Diffusion将自己的照片变成一个可怕的万圣节主题角色。这款照相亭是基于人工智能技术的,能够通过对照片的处理实现各种特效效果。此外,用户...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page