漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-25 talkingdev

CLIP-DINOiser,实现零样本语义分割

最近,研究人员提出了一种名为CLIP-DINOiser的新方法,它将CLIP模型的零样本能力与自监督特征相结合,从而实现了更好的语义分割,无需标注。CLIP-DINOiser方法使用了自监督任务DINO来学习图像特征,并将其与CLIP模型...

Read More
2023-12-25 talkingdev

Llava多模交互模型:聊天式文本、图像输入和输出

Llava是一个强大的多模型模型。该交互式设计现在允许聊天式交错文本、图像输入和图像输出。Llava是一个深度学习模型,能够对文本和图像数据进行联合建模,并产生准确的输出。与其他模型不同的是,Llava模型不仅考虑...

Read More
2023-12-25 talkingdev

单张图像快速重建3D模型技术突破:高斯飞溅技术推动3D重建前进

近日,一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术,通过学习性技术将图像中的每个像素映射到一个3D高斯函数中,从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”,...

Read More
2023-12-25 talkingdev

论文:消费级GPU上的LLMs PowerInfer

本文探讨了模型拥有热神经元和很少使用的冷神经元的想法。通过将热神经元预加载到GPU上,您可以节省内存而不会牺牲太多吞吐量。同时,该文提供了一个可用的代码库。

Read More
2023-12-25 talkingdev

论文:采用序列感知损失函数的图像生成技术

研究人员开发了一种“序列感知”损失函数,以改进去噪概率模型(DPM),解决了图像生成中时间步长相关性的问题。这种新方法不仅提供了更紧凑的损失估计,而且在诸如CIFAR10和CelebA等数据集上显示出显著的图像质量改进,...

Read More
2023-12-25 talkingdev

苹果最新AI研究或将完全改变您的iPhone

苹果公司发布了两篇论文,介绍了新的三维头像和高效语言模型推理技术,这些技术可以让AI系统在iPhone和iPad上运行。这些技术的引入将使iPhone和iPad变得更加智能,更加个性化。这意味着用户可以在他们的设备上运行更...

Read More
2023-12-25 talkingdev

Midjourney V6发布,实现图片内文字识别和全新提示方式

Midjourney V6已经发布alpha版。这个更新大大提高了图像质量,并使模型能够在图像中生成可读的文字。它还配备了全新的提示方式,更加敏感,更能理解用户。如果用户习惯于Midjourney V5提示,他们可能需要重新学习提...

Read More
2023-12-25 talkingdev

苹果开发突破性方法,使LLMs可以在iPhone上运行

苹果研究人员使用创新的闪存利用技术,在苹果设备上部署大型语言模型取得了关键突破。该方法采用窗口化和行列捆绑技术,以最小化数据传输并最大化闪存吞吐量。它可以使AI模型在标准处理器上运行速度提高高达5倍,在...

Read More
  1. Prev Page
  2. 314
  3. 315
  4. 316
  5. Next Page