漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-06 talkingdev

DMP开源,可提升AI图像预测精度

Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优...

Read More
2023-11-09 talkingdev

OVIR-3D,可实现即时3D搜索技术开源

OVIR-3D是一项创新技术,可以通过2D图像融合实现从文本提示中检索3D对象,无需3D数据训练,从而实现即时实时搜索功能,非常适合机器人应用。该技术的最新成果是在GitHub上发布了代码库,使更多开发者可以在其应用中...

Read More
2023-10-25 talkingdev

领先AI专家呼吁全球对AI风险采取紧急行动,类似于气候危机

谷歌AI部门CEO Demis Hassabis警告称,世界需要像应对气候危机一样紧急应对AI风险。他建议成立一个监管机构,类似于气候变化政府间气候变化专门委员会,来处理AI风险。Hassabis认为,AI具有极高的潜力,但其潜在的风...

Read More
2023-10-18 talkingdev

LLMs在场景图生成中的改进技术应用开源

本研究介绍了LLM4SGG弱监督场景图生成方法,该方法利用大型语言模型的能力,从图像标题中更好地提取和对齐关系,解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

Read More
2023-10-17 talkingdev

论文:高级头部姿态评估技术

确定某人头部的朝向对很多技术应用非常重要。这些研究人员开发出一种新的方法,可以从任意角度估计头部位置。

Read More
2023-10-16 talkingdev

AI 2023:语言模型的行业现状

本文对语言模型行业进行了全面总结。其中对于安全性、能力、芯片等方面进行了深入讨论。值得一提的是,关于人工智能电影制作、资本成本和人工智能推动的IPO的预测也十分有趣。

Read More
2023-10-05 talkingdev

现在可以在Bing Chat中使用OpenAI的DALL-E 3 AI图像生成器

微软已将OpenAI的DALL-E 3集成到Bing Chat中,为用户提供了更强大的图像生成功能。DALL-E 3承诺提高了对提示的理解,能生成更有创意和逼真的图像。此外,微软计划将DALL-E技术应用于其他产品中,例如Windows的Paint...

Read More
2023-09-28 talkingdev

解析AI生成螺旋艺术现象的热潮

近期,一位Reddit用户使用Stable Diffusion和ControlNet AI技术生成的螺旋艺术作品在网络上引发热议,这一现象标志着人们对AI生成艺术的观念正在发生改变。这位用户利用了最新的AI技术,成功地创作出了具有独特视觉...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page