漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-14 talkingdev

Pipecat:构建语音及多模态对话Agent框架

Pipecat是一个构建语音和多模式对话代理的框架。这个框架使开发者能够更便捷地创建和管理语音交互系统。多模式对话代理则是指可以处理多种类型输入(如文字、语音、图像等)的人工智能系统。Pipecat不仅适用于创建语...

Read More
2024-05-03 talkingdev

特斯拉准备推出自己的车载语音助手

特斯拉的最新软件更新中包含了隐藏的代码,表明该公司正在为语音助手的推出做准备。目前关于新特斯拉语音助手的信息很少,但埃隆·马斯克此前曾表示,他希望特斯拉的驾驶员能够在车内进行一切操作,无需手动输入。该...

Read More
2024-04-28 talkingdev

苹果是否应该废弃Siri并重新开始?

尽管自2011年发布以来,苹果的Siri已经进行了逐渐的更新,但这款语音助手在与其竞争对手的竞争中却落后了,这也引发了对其进行重大改革或替换的呼声。Siri功能的持续问题已经降低了其声誉,用户对其糟糕的语境理解能...

Read More
2024-04-17 talkingdev

嵌入式技术是AI初学者应用开发的好起点

嵌入式技术是人工智能应用开发的好起点,它使得设备能够收集和处理数据,从而为开发人员提供了一个更好的数据样本集。例如,使用嵌入式技术可以对设备进行监控,从而优化用户体验和提高生产效率。此外,嵌入式技术还...

Read More
2024-04-10 talkingdev

苹果新AI模型助力Siri理解iOS应用界面

苹果公司开发了一款名为Ferret-UI的多模态大型语言模型(LLM),该模型具备理解移动设备用户界面的能力,有望让Siri更有效地理解并与屏幕上的元素进行互动。Ferret-UI的出现预示着Siri将能够更加直观地与iOS应用进行...

Read More
2024-04-03 talkingdev

三星或将通过Galaxy AI重新定义Bixby

据最新报道,三星正计划对其语音助手Bixby进行重大升级,意图融入与Galaxy S24系列相似的生成性AI技术。这一措施预示着三星对于人工智能领域的进一步探索和应用。通过整合这种先进的AI技术,Bixby有望在智能交互和个...

Read More
2024-03-22 talkingdev

苹果与谷歌洽谈,或将集成Gemini AI技术于iPhone

苹果公司正在与谷歌进行谈判,以期将Gemini生成性AI技术集成到iPhone中。此外,苹果也在考虑使用OpenAI的ChatGPT。这一举措标志着苹果在人工智能领域的雄心壮志,可能为iPhone用户带来前所未有的智能体验。若谈判顺...

Read More
2024-02-08 talkingdev

MetaVoice-开源13亿文本到语音模型

Meta Voice 是一个小而强大的文本到语音模型,支持生成和语音克隆。该模型基于深度神经网络和自回归模型,可用于多种应用场景,如语音合成、语音助手等。此外,Meta Voice 还支持多种语言,包括英语、中文、日语等。...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page