漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-25 talkingdev

开源Llama模型工具集,提高深度学习效率

Facebook发布了一组工具、资源和示例,用于使用Llama模型系列。该工具集可帮助深度学习从业人员更高效地进行模型训练和应用。Llama模型系列由Facebook AI Research开发,已被广泛用于计算机视觉领域。这个工具集将包...

Read More
2023-12-25 talkingdev

CLIP-DINOiser,实现零样本语义分割

最近,研究人员提出了一种名为CLIP-DINOiser的新方法,它将CLIP模型的零样本能力与自监督特征相结合,从而实现了更好的语义分割,无需标注。CLIP-DINOiser方法使用了自监督任务DINO来学习图像特征,并将其与CLIP模型...

Read More
2023-12-25 talkingdev

Llava多模交互模型:聊天式文本、图像输入和输出

Llava是一个强大的多模型模型。该交互式设计现在允许聊天式交错文本、图像输入和图像输出。Llava是一个深度学习模型,能够对文本和图像数据进行联合建模,并产生准确的输出。与其他模型不同的是,Llava模型不仅考虑...

Read More
2023-12-25 talkingdev

单张图像快速重建3D模型技术突破:高斯飞溅技术推动3D重建前进

近日,一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术,通过学习性技术将图像中的每个像素映射到一个3D高斯函数中,从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”,...

Read More
2023-12-25 talkingdev

Midjourney V6发布,实现图片内文字识别和全新提示方式

Midjourney V6已经发布alpha版。这个更新大大提高了图像质量,并使模型能够在图像中生成可读的文字。它还配备了全新的提示方式,更加敏感,更能理解用户。如果用户习惯于Midjourney V5提示,他们可能需要重新学习提...

Read More
2023-12-22 talkingdev

Midjourney V6发布:图片中可生成易读文本,提示功能得到全面升级

Midjourney V6已经发布alpha版。此次更新大幅提高了图像质量,并使模型能够在图像中生成易读文本。它还配备了全新的提示方法,更加灵敏,更加擅长理解用户。如果用户习惯于Midjourney V5提示,他们可能需要重新学习...

Read More
2023-12-22 talkingdev

tinyzero:让任何人都能在任何环境中轻松训练类AlphaZero的智能体

由DeepMind开发的AlphaZero程序可以精通诸如国际象棋、日本象棋和围棋等游戏。现在,tinyzero可以让任何人都能轻松训练类似AlphaZero的智能体,无论是在游戏中还是在其他环境中。tinyzero是GitHub上的一个开源项目,...

Read More
2023-12-21 talkingdev

论文:利用卷积神经网络进行深度伪造检测

本研究提出了一种深度学习方法,利用四个预训练的卷积神经网络模型来识别视频中的深度伪造人脸,可实现高精度检测。深度伪造技术已成为一种严重的威胁,对政治、社会和经济稳定造成了巨大的影响。该研究提出的方法可...

Read More
  1. Prev Page
  2. 130
  3. 131
  4. 132
  5. Next Page