漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-14 talkingdev

Pipecat:构建语音及多模态对话Agent框架

Pipecat是一个构建语音和多模式对话代理的框架。这个框架使开发者能够更便捷地创建和管理语音交互系统。多模式对话代理则是指可以处理多种类型输入(如文字、语音、图像等)的人工智能系统。Pipecat不仅适用于创建语...

Read More
2024-04-29 talkingdev

小巧智能家居平台的大能量:Home Assistant加入开放家居基金会

Home Assistant近日加入了开放家居基金会,这是一个旨在通过优先考虑隐私、选择和可持续性来对抗大科技公司影响的非营利组织。这一转变使得Home Assistant能在保持其核心开源原则的同时扩大其对消费者的吸引力。接下...

Read More
2024-04-17 talkingdev

嵌入式技术是AI初学者应用开发的好起点

嵌入式技术是人工智能应用开发的好起点,它使得设备能够收集和处理数据,从而为开发人员提供了一个更好的数据样本集。例如,使用嵌入式技术可以对设备进行监控,从而优化用户体验和提高生产效率。此外,嵌入式技术还...

Read More
2024-03-29 talkingdev

Hume推出情感语音界面 引领人工智能新趋势

Hume公司近日发布了一项创新产品——情感语音界面(Empathic Voice Interface,简称EVI),这是首款集成了情感智能的对话式人工智能技术。EVI能够理解和模拟人类情感,通过语音交互提供更为自然、贴心的用户体验。这一...

Read More
2024-03-26 talkingdev

全新Open Interpreter O1 Light:开启AI家居新时代

Open Interpreter O1 Light是一款创新的便携式语音接口设备,能够控制家中的电脑。它不仅能看见屏幕内容,还能使用各类应用程序,并不断学习新技能。作为一款开源基础设备,O1 Light为人工智能设备带来了全新的发展...

Read More
2024-01-30 talkingdev

亚马逊放弃以14亿美元收购Roomba制造商iRobot的交易

由于交易没有获得欧盟的监管批准,因此亚马逊放弃了以14亿美元收购Roomba制造商iRobot的交易。该交易旨在将iRobot的智能家居技术与亚马逊的Alexa智能音箱相结合,以进一步推进亚马逊在智能家居市场的发展。然而,该...

Read More
2024-01-09 talkingdev

论文:Phi-2语言模型助力多模态LLaVA-Phi发布

LLaVA-Phi是一款创新的多模态助手,它使用Phi-2语言模型。尽管参数只有2.7B,但LLaVA-Phi在多模态对话中表现出色,结合了文本和视觉。该助手可以在多个领域内使用,例如智能家居和自动驾驶等。

Read More
2024-01-08 talkingdev

论文:掌握3D场景,增强视觉问答技术

随着视觉问答技术的不断发展,大多数模型只涉及2D推理,忽略了3D视觉场景的复杂性。这项研究提出了3D感知的视觉问答技术。通过对3D场景的理解和分析,模型可以更精准地回答问题,具有更高的准确率和可解释性。该技术...

Read More
2023-11-17 talkingdev

论文:智能眼镜上的物体检测技术

该团队创建了一个新的面向视觉的RISC-V硬件,并训练了一个超小的YOLO计算机视觉模型,实现了低功耗和极低延迟的实时物体检测。该技术可广泛应用于智能眼镜、自动驾驶、智能家居等领域。

Read More
2023-11-10 talkingdev

Ring这是下一个智能家居必备品吗?

Amazon以12亿美元收购了Ring,而Google则以32亿美元收购了Nest。如果你错过了这些公司,现在是你投资RYSE的机会,该公司有望主导智能窗帘市场,股价仅为1.25美元/股。

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page