漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-16 talkingdev

人工智能招聘工具上线,企业招人更高效

近日,一款名为“Hiring Tool”的人工智能招聘工具上线。该工具基于AI技术,能够自动筛选和管理求职者简历,快速匹配最合适的候选人。同时,它还能够根据企业需求智能推荐人才,提高招聘效率,节省用人成本。据了解,...

Read More
2023-11-16 talkingdev

论文:MonoDiffusion-无需地面真值的深度估计技术

MonoDiffusion是一种新的自监督单目深度估计框架,其独特的方法将深度估计问题视为迭代去噪过程。它利用预训练的教师模型指导伪地面真值扩散过程,从而提高深度图精度,无需在训练中使用实际的深度真值。

Read More
2023-11-16 talkingdev

免费试用英特尔云平台,探索最新的人工智能硬件

您需要更多的计算能力(和选择)来微调您的生成式人工智能吗?使用实践教程和实际代码样例学习✔️。通过不同的硬件配置评估性能和加速度✔️。构建异构应用程序,开发自己的原型,并对AI工作负载进行基准测试。从免费层开...

Read More
2023-11-15 talkingdev

2023年人工智能和开源技术发展概述

2023年,人工智能和开源技术领域经历了许多重大发展。从人工智能的硬件和软件创新,到开源技术的社区合作和开放性,这些发展推动了行业的不断进步。在硬件方面,各大公司都在竞相研发新一代的芯片,以应对人工智能应...

Read More
2023-11-15 talkingdev

使用视觉语言模型实现自主驾驶

本报告评估了GPT-4V在自主驾驶中的应用,重点关注其在场景理解、决策制定和实时响应方面的能力。GPT-4V是一种基于视觉语言模型的人工智能技术,能够自动识别和理解图像中的物体、道路、标志和其他要素,并作出相应的...

Read More
2023-11-15 talkingdev

论文:保护视觉语言模型的水印方法

在深度学习领域中,视觉语言模型(VLM)越来越受到重视。由于Embedding as a Service Vision-Language Pre-Trained Models(VLPM)中的预训练模型包含了大量的视觉和语言信息,因此这种模型很容易成为恶意攻击的目标...

Read More
2023-11-14 talkingdev

LLaVa Plus模型用于语言和视觉技能学习

LLaVa模型是一个开源模型,结合了语言和视觉。这个新版本允许使用图像编辑、生成等工具来进行指导,调整模型。LLaVa Plus模型提供了更高的精度和更好的性能。

Read More
2023-11-14 talkingdev

新注意力机制DG-SCT提升多模态任务音视频模型

近日,研究人员开源了一个名为Dual-Guided Spatial-Channel-Temporal(DG-SCT)的新型注意力机制,可用于增强预先训练的音频-视频模型,以用于多模态任务。该机制具有两个分支,一个是空间通道分支,另一个是时间分...

Read More
  1. Prev Page
  2. 99
  3. 100
  4. 101
  5. Next Page