漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-07 talkingdev

论文:多模态AI幻觉,解读视觉语言模型的错误描述现象

本篇论文揭示了大型视觉语言模型(LVLMs)为什么有时会错误地描述图像的原因,这种现象被称为多模态幻觉。语义转移偏差,特别是在段落中断处,是一个关键因素。研究人员发现,模型可能会出现误导性的预测,这些预测...

Read More
2024-02-06 talkingdev

Pygmalion推理引擎开源

Aphrodite引擎可以用于减少VRAM需求,提高AI推理工作负载的吞吐量。Pygmalion推理引擎是一种全新的AI推理引擎,它可以在减少VRAM需求的同时提高吞吐量。该引擎基于Aphrodite引擎并进行了优化,可以在保持准确性的同...

Read More
2024-02-06 talkingdev

论文:提升效率的推荐系统

PAP-REC提出了一种自动创建个性化提示的推荐语言模型的方法,增强了它们的效率和效果。该方法基于用户的历史行为和偏好,并且能够自动识别关键字和短语,以生成更准确的推荐。同时,该方法能够在不增加额外计算成本...

Read More
2024-02-05 talkingdev

AI客户发现者-精确找到潜在客户的联系数据

随着人工智能技术的不断进步,AI客户发现者(产品)的面世,为企业寻找潜在客户带来了全新的体验。AI客户发现者(产品)能够通过人工智能技术精确地找到潜在客户的联系数据,使企业不再盲目地投放广告,节省了大量的...

Read More
2024-02-05 talkingdev

开源嵌入模型的新阶段

BGE-M3项目介绍了一种多功能的嵌入模型,其在多功能性(密集、多向量和稀疏检索)、多语言性(支持100多种语言)和多粒度性(处理从短句子到长达8192个标记的文档输入)方面表现优异。它使用混合检索管道,结合不同...

Read More
2024-02-02 talkingdev

Norton开源,可大幅提高长视频理解能力

最新研究表明,长视频理解领域存在多粒度噪声对应问题,影响了视频语言研究的准确性。为了解决这一问题,研究人员开发了一种名为Norton的新方法,应用了最优传输算法来提高长期视频理解。该方法通过处理多粒度噪声对...

Read More
2024-02-02 talkingdev

微软利用激光技术解决LLM幻觉问题

1月份微软研究论坛上,Dipendra Misra提出了一种名为“Layer-Selective Rank Reduction(LASER)”的技术,通过用一个较小的近似矩阵替换权重矩阵,提高了大型语言模型(LLM)的准确性

Read More
2024-01-31 talkingdev

生物识别技术利用图像扭曲提高隐私保护

最新的图像扭曲技术让面部图像对人类不可识别,但仍然可以被AI识别,从而在生物识别系统中实现隐私保护和准确性之间的平衡。这项技术已经在GitHub上发布,可以帮助开发人员更好地保护用户的隐私。与传统的面部识别技...

Read More
  1. Prev Page
  2. 30
  3. 31
  4. 32
  5. Next Page