漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-12 talkingdev

Giskard开源:针对从表格到LLMs的模型测试框架

Giskard是一个开源的测试框架,用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力,还可以测量它的稳定性、可解释性和鲁棒性。Gisk...

Read More
2023-12-08 talkingdev

BenchLLM开源,测试大型多模态模型的基准

这个项目介绍了BenchLMM,一个专门设计用于测试GPT-4V和LLaVA等大型多模态模型对各种图像样式的鲁棒性的基准。

Read More
2023-12-06 talkingdev

IMMA为文本转图模型提供保护

IMMA是一种新技术,可以为文本转图模型提供保护,以防止被恶意适应生成有害内容。IMMA是一种基于信息瓶颈原理的技术,可以将文本编码为低维向量,然后将其与图像编码结合起来,以生成所需的图像。此技术不仅可以防止...

Read More
2023-11-14 talkingdev

深度探究:对语言模型的对抗攻击

本文介绍了对语言模型系统正在出现的不同攻击方式。它包含了关于不同类型攻击的优秀信息,以及一些已被证明有效的缓解措施。近年来,随着人工智能技术的快速发展,语言模型在自然语言处理等领域的应用越来越广泛。但...

Read More
2023-11-10 talkingdev

论文:自动驾驶车辆的地标匹配技术有新突破

自动驾驶汽车的地标匹配是一项重要的技术,其能力直接关系到自动驾驶汽车的定位和导航精度。近日,研究人员提出了一种名为RobustMat的新方法,通过使用空间信息和神经微分方程,改进了自动驾驶汽车在不同条件下匹配...

Read More
2023-10-27 talkingdev

基于稀疏深度细节的水下车辆实时深度估计模型开源

近日,一项名为‘Real-Time Depth Estimation for Underwater Vehicles’的研究成果在GitHub上发布。该研究提出了一种针对水下车辆的模型,可以通过结合稀疏深度细节从单个图像中实时估计深度。该模型是通过深度学习框...

Read More
2023-10-18 talkingdev

关于LoRA 微调的几点洞见想法

最近,一组研究人员针对数百个实验结果,总结出了微调 LoRA 的几点洞见。研究人员发现,针对特定场景进行细致的参数调整可以显著提升 LoRA 的性能,同时,合理的信道选择和传输功率也是提高 LoRA 传输可靠性的关键。...

Read More
2023-08-29 talkingdev

AudioLDM2-声音与音乐生成模型开源

近日,一款出色的开源声音与音乐生成模型在GitHub上引发关注。这款模型运行速度快,能生成节拍、音效和基础对话。操作简单,且对提示样式具有较强的鲁棒性。该模型的出现,无疑为音频处理领域的发展注入了新的活力,...

Read More
2023-08-29 talkingdev

Meta AI发布基于虚幻引擎的超真实图形数据集

Meta AI近日公布了一系列利用虚幻引擎进行超真实图像处理的数据集。发布的数据集包括用于基础模型研究的PUG:动物,用于评估图像分类器鲁棒性的PUG:ImageNet,以及用于视觉语言模型评估的PUG:SPAR。这些数据集的发...

Read More
2023-08-07 talkingdev

PerceptionCLIP,开源增强zero-shot击图像分类方法

一项最新研究介绍了PerceptionCLIP,这是一种模拟人类视觉感知过程的两步图像分类方法,旨在更好地利用CLIP,一种突出的视觉语言模型。首先,通过识别背景属性并利用它们区分前景物体,这种新方法在图像分类任务中提...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page