漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-13 talkingdev

三星展示AI实时翻译功能,将于2024年发布

三星一直在人工智能领域保持低调,但最近展示了一项用于电话的实时AI翻译功能。该功能预计将于2024年发布。这项新技术将允许用户在电话中进行实时翻译,无需等待或使用第三方应用。三星表示,这项功能将使用自然语言...

Read More
2023-11-09 talkingdev

自动生成体育比赛解说工具

这个notebook使用了OpenAI的多项新技术,以令人信服的方式解说体育比赛。它可以自动识别比赛中的场景,例如球员的位置和行动,球的位置和轨迹,比赛的得分等等。此外,它还可以根据比赛的进展和结果,实时生成解说的...

Read More
2023-11-09 talkingdev

OVIR-3D,可实现即时3D搜索技术开源

OVIR-3D是一项创新技术,可以通过2D图像融合实现从文本提示中检索3D对象,无需3D数据训练,从而实现即时实时搜索功能,非常适合机器人应用。该技术的最新成果是在GitHub上发布了代码库,使更多开发者可以在其应用中...

Read More
2023-11-08 talkingdev

TopicGPT: 以用户为中心的主题建模开源

由于传统主题建模技术的限制,主题建模的效果往往无法满足用户的需求,但是近日,一种名为TopicGPT的新技术正在逐渐流行。TopicGPT是一种基于LLMs的主题建模技术,通过更好的主题识别和可解释性,使得用户可以更为精...

Read More
2023-11-08 talkingdev

论文:深度感知技术提升异常检测效果

新技术DADA系统集成3D数据和RGB图像,实现了卓越的表面异常检测,速度和准确度均优于传统方法,无需大量训练数据集。

Read More
2023-10-23 talkingdev

深度探讨:构建基于LLM的Web应用程序

大多数组织机构没有资源在GPU上运行大型模型,但是有一个强大的开源推动力量在本地运行这些模型。本文探讨了这种推动力量以及LangChain + Ollama集成。 LLN(Local Low Rank Normalization)是一种用于处理基于卷积...

Read More
2023-10-23 talkingdev

OpenAI即将达成协议,估值达800亿美元

据报道,由Thrive Capital领导的交易即将达成,该交易将OpenAI的估值推高至800亿美元,在不到六个月的时间里将其价值翻了一番。这种估值的激增始于OpenAI的ChatGPT发布,引发了对领先AI公司的重大投资。尽管初创公司...

Read More
2023-10-20 talkingdev

ProductAI推出AI生成产品照片技术

ProductAI是一家提供人工智能(AI)解决方案的公司,日前推出了一项新技术,可通过AI生成高质量的产品照片。这项技术基于计算机视觉和机器学习,能够快速、准确地生成符合规格的产品照片。根据公司表示,这项技术不...

Read More
2023-10-17 talkingdev

论文:SupFusion提高LiDAR和相机检测能力

一篇发表在arXiv上的论文介绍了一种新技术SupFusion,它能够使激光雷达(LiDAR)和相机系统更好地协同工作,用于检测汽车或行人等物体。这项技术使用多任务学习方法,同时考虑激光雷达和相机的输出,将它们融合成更...

Read More
2023-10-13 talkingdev

whispering-llama:最新开源多模态融合技术以增强语音识别

研究人员开发了一种新技术,将声音信息和语言数据结合起来,纠正自动语音识别系统中的错误。该技术基于交叉模态融合,使用视觉和语言信息来提供更准确的识别结果。此外,该技术还可以提供更好的语音合成能力。研究人...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page