漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-26 talkingdev

论文:利用文本描述理解并标记3D场景的PVLFF新模型

科研人员近日开发出一种名为PVLFF的新模型,这种模型能够观察3D场景,并不仅能识别其中的内容,还可以利用文本描述区分同一物体的不同实例。在现实世界中,同一物体可能有许多不同的实例,而这种模型能够通过文本描...

Read More
2023-09-26 talkingdev

Odin开源:使用GPT-4从您的数据生成知识图谱

最近,GitHub Repo上的一个新项目Odin引起了业界的广泛关注。Odin的主要功能是利用GPT-4技术从用户的数据中生成知识图谱。知识图谱是一种以图形方式表示知识的方法,能够帮助用户更好地理解数据,并从中提取有价值的...

Read More
2023-09-26 talkingdev

深度评估:DeepEval帮助您安心部署LLM流水线

DeepEval是一个提供Pythonic方式进行离线评估的工具,专为LLM(语言模型)流水线设计。使用DeepEval,开发者能够在部署到生产环境之前,对其LLM流水线进行深度和全面的评估。这大大降低了生产环境中出现错误的风险,...

Read More
2023-09-26 talkingdev

通过被动摄像头增强深度估计的研究

这项研究提出了一种在被动摄像头中模拟主动立体感的方法,而无需使用物理图案投影仪。研究人员通过利用外部传感器的深度数据虚拟叠加图案,克服了传统设置的局限性。这种方法在各种数据集上都增强了立体算法和深度学...

Read More
2023-09-26 talkingdev

Spotify借助AI技术推出克隆和翻译播客者音频的新功能

近日,Spotify推出一项由AI驱动的语音翻译功能,该功能能够利用原播客者的声音在其他语言中复制播客节目。这项技术依赖于OpenAI的Whisper进行转录,很可能用于声音复制,使得翻译能够保持播客者独特的声音。这一创新...

Read More
2023-09-26 talkingdev

ChatGPT的全新升级:视觉、听觉和语音的全方位提升

ChatGPT正面临一次重大的模式升级,增加了多种新功能。不久的将来,用户将能够与模型进行语音交流,并得到模型的语音回应。此外,用户还可以上传图片并向ChatGPT提问有关图片的问题。这次升级使得ChatGPT在视觉、听...

Read More
2023-09-26 talkingdev

亚马逊投资最高40亿美元在Anthropic,进一步拓展人工智能领域

据最新报道,全球电商巨头亚马逊正投资最高40亿美元在Anthropic公司。该公司是一家专注于人工智能研究的创新型科技公司,其安全管理体系保持不变。交易中涉及的内容包括知识产权和计算机选项。这一投资举动显示出亚...

Read More
2023-09-26 talkingdev

Minum:一款极简实验性Web框架

Minum是一款极简实验性Web框架。它具有带有磁盘持久化的内存数据库、服务器端模板、日志和测试框架、HTML解析等功能。 Minum的编译大小只有150千字节,其中包括必需的依赖项在内,生产代码仅有3,757行。

Read More
  1. Prev Page
  2. 919
  3. 920
  4. 921
  5. Next Page