漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-29 talkingdev

LightGlue:更智能快速的图像匹配技术(GitHub开源)

LightGlue是一种新技术,可以更轻松、更快速地找到图片之间的相似之处,甚至比当前最好的方法Superglue还要好。LightGlue最好的部分是它可以根据图像复杂度进行自适应,对于简单的图像可以更快地工作,在实时应用中...

Read More
2023-06-30 talkingdev

LLM技术驱动的自主代理人

本文深入介绍了如何使用LLM技术来驱动自主代理人。

Read More
2023-06-30 talkingdev

MotionGPT: 融合运动和语言的方法(GitHub仓库)

本仓库介绍了MotionGPT,这是一种将人体动作和语言相结合的新技术。通过将运动视为一种独立的语言形式,该工具可以帮助改善与运动相关的任务,例如根据文本输入预测或描述动作。

Read More
2023-06-27 talkingdev

DeepMind声称其下一个聊天机器人将能与ChatGPT媲美

DeepMind的Gemini大型语言模型是使用AlphaGo的技术进行训练的,AlphaGo是第一个在围棋比赛中击败职业人类选手的AI系统。Gemini可以规划、解决问题和分析文本。它将AlphaGo类型系统的优势与大型语言模型的能力相结合...

Read More
2023-06-27 talkingdev

人工智能专家对未来行业的预测调查结果

在2016年,对人工智能专家进行了一项关于未来行业发展的调查。调查结果显示,专家们对人工智能的发展持有积极的态度,并提出了许多预测。其中,一些重点包括:1.人工智能将在各个领域得到广泛应用,包括医疗、金融、...

Read More
2023-06-27 talkingdev

一站式图像修复解决方案(GitHub仓库)

“PromptIR”是一种新方法,使用提示信息从退化版本中恢复高质量图像,无论退化的类型或严重程度如何。这种先进技术适用于各种图像问题,如噪声、模糊和雾霾。

Read More
2023-06-27 talkingdev

Kor:利用LLMs从文本中提取结构化数据

Kor是一种新的技术,它利用LLMs(Language Learning Models)从文本中提取结构化数据。LLMs是一种能够理解和处理自然语言的模型,它们可以对文本进行深度分析,找出其中的关键信息和结构。Kor通过使用LLMs,可以将文...

Read More
2023-06-23 talkingdev

ElevenLabs推出新的生成式语音AI产品并宣布1900万美元A轮融资

声音技术研究公司ElevenLabs已经完成1900万美元的A轮融资,用于继续进行语音AI研究和产品部署,这是其使所有内容普遍可访问的使命的一部分。该轮融资由Nat Friedman、Daniel Gross和Andreessen Horowitz领投。该产品...

Read More
  1. Prev Page
  2. 623
  3. 624
  4. 625
  5. Next Page