漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-08 talkingdev

Perplexity获得7360万美元融资,受到顶尖风投青睐

Perplexity是一家生成式搜索公司,其在技术圈内得到了广泛的应用。近日,该公司获得了来自顶尖风投的又一轮融资。本轮融资总额为7360万美元。Perplexity表示,这笔融资将用于加速其技术研发和市场拓展。Perplexity的...

Read More
2023-12-15 talkingdev

FIND多用途AI模型接口开源,提升图像和数据理解能力

FIND推出了一个多用途AI模型接口,使得AI模型能够更好地理解图像和数据集,而无需更改核心模型。该接口使用了一种新的嵌入对齐方法,能够将不同任务的嵌入空间对齐起来,从而提高模型的泛化能力。这一技术的研发背后...

Read More
2023-12-15 talkingdev

Google推出Imagen2,提供文本和标志生成功能

Google推出了Imagen 2,这是一种增强的AI图像模型,可供经批准的Google Cloud Vertex AI用户使用,提供文本渲染,标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...

Read More
2023-11-13 talkingdev

Adept实验室推出企业智能代理系统

Adept实验室正在为企业建立一个有用的代理系统。现在它正在推出小型演示,供人们与之互动,如委派知识工作任务、使用新工具或处理非结构化数据。 Adept的代理系统能够根据用户需求,执行特定的任务并提供相关的反馈...

Read More
2023-10-25 talkingdev

OpenAI能否在消费者和企业市场上取得胜利?

OpenAI目前通过ChatGPT和API赢得了消费者和企业市场,但他们能否继续这么做还不确定。OpenAI是一家人工智能研究实验室,其目标是创建安全和有益的人工智能。ChatGPT是一种语言生成模型,可以生成与给定输入相关的自...

Read More
2023-10-17 talkingdev

人工通用智能已经存在

尽管如今的AI模型并不完美,但仍有很大可能最终被认定为人工通用智能的首批真正例子。人工智能技术正在飞速发展,从语音识别到图像识别,再到自动驾驶和机器人等领域,都有了巨大的进步。但是,现有的AI技术仍然存在...

Read More
2023-10-04 talkingdev

论文:使多模态大型语言模型适应各种任务

多模态大型语言模型在许多任务中表现优秀,但在定位图像中的特定对象方面往往存在困难。为了改善这一问题,研究人员已经开发出一种新的方法:将物体的位置转化为文本,并通过特殊任务进行模型的训练。这种方法的出现...

Read More
2023-10-03 talkingdev

通过对话教授图像识别模型:开创视觉-语言模型新方法

研究人员已经开发出一种新的方法,仅通过自然语言提示就可以提高视觉-语言模型的性能。这些模型能够理解文本和图像,而研究人员的新方法将使它们在处理视觉和语言信息时更加精确。通过与模型进行对话,研究人员可以...

Read More
2023-09-27 talkingdev

OpenAI的GPT-4虽然在视觉领域有所突破,但仍存在缺陷

尽管OpenAI在防止其GPT-4视觉模型破解CAPTCHAS以及基于年龄和种族估计人的年龄方面已经取得了一定的进步,但它仍然有时难以进行推理,并且仍然容易产生幻觉。这些问题暴露出,尽管我们在人工智能的发展和应用上取得...

Read More
2023-09-21 talkingdev

DFormer开源,更深入理解RGB-D图像

DFormer是一种独特的方法,可以同时研究图像的颜色和深度。与旧有的方法不同,DFormer专为RGB-D图像设计。RGB-D图像是一种同时包含颜色信息(R,G,B)和深度信息(D)的图像。DFormer的设计目标是提供一种更有效的...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page