Rabbit与ElevenLabs达成合作,将其语音命令技术整合到即将推出的r1设备中,通过低延迟模型提升人机交互的自然体验。首批r1设备将具备聊天机器人互动和双向翻译等功能,并计划于3月31日前发货。尽管ElevenLabs面临其...
Read More近日,Draw-and-Understand项目推出了一款名为SPHINX-V的多模态大型语言模型。该模型通过视觉提示,旨在增强人与AI之间的互动交流。SPHINX-V结合了文本、图像与声音等多种信息输入,通过深度学习技术,实现了更加自...
Read More研究人员最近开发了一种名为R2-Tuning的技术,这项技术能够通过识别口语提示来理解视频中的特定时刻。R2-Tuning技术的核心在于其能够对视频内容进行高效的分析和处理,使得机器能够像人类一样理解视频内容中的关键时...
Read MoreEmo是一款能够实时预测并模仿人类面部表情的机器人,这一突破性的技术极大地增强了人机交互体验。Emo通过高精度的传感器和先进的算法,能够捕捉到人类的微妙表情变化,并迅速做出相应的反应。这不仅使得机器人更加自...
Read MoreCharacter Voice是一套功能,使用户能够在一对一聊天中听到角色对他们说话,将Character.AI体验提升到一个新的层次。这是公司构建多模态界面计划的第一步,该界面将促进更无缝、直观和引人入胜的互动体验。多模态界...
Read More谷歌的研究团队近日推出了一款名为VLOGGER的人工智能技术,该技术能够通过单张照片生成人物说话和活动的逼真视频。这一技术突破不仅在视觉效果上取得了显著进展,也为人机交互和虚拟现实领域带来了新的可能性。VLOGG...
Read MoreFigure 公司已经采用 OpenAI 技术,使得其机器人可以与人进行完整对话。OpenAI 的模型提供高级别的视觉和语言智能,而 Figure 的神经网络则可以提供快速、低级别的机器人动作。这篇文章包含一个视频,展示了一个人与...
Read More本文敦促UX设计师在GenAI界面中创新超越Quick Actions和Multi-Turn模式,强调需要更直观、适应性更强的设计来适应人工智能的不断发展。强调用户赋权和上下文理解,重点介绍了有前途的替代UX模式,如拖放、语音交互和...
Read MoreCovariant推出了RFM-1,旨在通过利用其Brain AI平台的大规模数据收集,为机器人语言构建大型语言模型,提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用,为机器人开启新的聊天界面。ChatGPT将有...
Read MoreMuse是一个旨在发明一个新的计算环境,更好地服务于科学家、作家、企业家、设计师和建筑师等重要知识工作者的项目。在Muse的探索中,研究人员们试图为知识工作者提供一个更加灵活、更加智能的工作环境,以便他们能够...
Read More