漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-17 talkingdev

PID-RGB图像转换为红外图像的新技术

研究人员已经开发了一种物理信息扩散(PID)模型,通过将物理定律纳入过程,以改进从RGB图像到红外图像的转换。这种模型结合了物理学和计算机科学的知识,使得图像转换更加精确、真实。这种新技术的应用领域非常广泛...

Read More
2024-07-11 talkingdev

Paints UNDO:模拟绘画过程,UNDO生成模型开源

来自ControlNet、IC-Light等图像生成系统的创建者,发布了名为Paints UNDO的系统,它是一个模型创建笔触以重建图像的系统。与以往的笔触系统不同,该模型可以撤消笔触,并且在进行过程中经常完全重新思考其方法,这...

Read More
2024-07-05 talkingdev

FlexiFilm-新扩散模型助力长视频生成

FlexiFilm 是一种专门为生成超过30秒的长视频而设计的扩散模型,它能够保证生成的视频具有高度的一致性和质量。这一新模型的出现,将在视频制作领域开启新的可能性。视频长度不再受限,而且模型生成的视频质量也得以...

Read More
2024-07-05 talkingdev

Magic Insert-谷歌开源图像语义对象插入技术

谷歌近日推出了一种名为'Magic Insert'的新方法,该方法可以通过扩散方式将语义对象插入到图像中。这种新技术打破了传统的图像处理方式,能够将语义对象与图像进行深度融合,从而产生更为逼真的视觉效果。谷歌同时也...

Read More
2024-07-03 talkingdev

向Jupyter笔记本中添加Mistral Codestral和GPT-4o

Mistral Codestral和GPT-4o最近被添加到了Jupyter Notebooks中。Mistral Codestral是一种新型的代码编辑器,它可以提高代码的编写速度和质量,而GPT-4o是一种新型的文本生成模型,可以生成更加精准和自然的文本。这...

Read More
2024-07-02 talkingdev

UnSAM-无监督SAM自动图像分割技术开源

无监督SAM(UnSAM)是一种新型的全图像分割模型,它消除了对人工注释的需求。UnSAM通过结合自上而下和自下而上的聚类方法,识别视觉场景中的层次结构,采用一种分而治之的方法。在复杂的视觉场景中,这种方法可以更...

Read More
2024-06-28 talkingdev

CriticGPT: 用GPT-4找出GPT-4的错误

据外媒报道,研究人员正在开发一种名为CriticGPT的新技术,以帮助找出GPT-4可能存在的错误。CriticGPT 是在 GPT-4 模型的基础上构建的,它通过分析 GPT-4 模型的输出,找出其中的错误和偏差。相比目前的技术,Critic...

Read More
2024-06-27 talkingdev

论文:DeepMind通过联合样本选择进行数据策划,进一步加速多模态学习

在预训练中,如何积极选择下一批最好的样本是一个挑战性和开放性的问题。DeepMind的这项工作探索了如何只花费10%的浮点运算和硬挖掘负样本,仍然能匹配各种任务的最新技术。在这个过程中,他们采用了一种名为“联合样...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page