漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-18 talkingdev

论文:一种音频模型能同时处理语音、音乐和声音

研究人员已经开发出一种名为EncodecMAE的方法,该方法借鉴了基于文本的模型的思想,用来创建一个通用音频模型。这种新的方法对于理解语音、识别音乐或者识别环境中的声音等不同类型的音频任务都有很好的效果。Encode...

Read More
2023-09-18 talkingdev

全方位解析AI版权问题

近期更新的一项工作深入探讨了AI版权的多个角度。AI版权可以广泛地被分类为输入和输出的法律挑战。论文并未提出任何观点,它只是许多常见问题的简要总结。AI版权问题的复杂性在于其涉及到众多领域,包括但不限于技术...

Read More
2023-09-18 talkingdev

Repilot开源, AI在修复代码方面的能力得到进一步提升

研究人员已经创建了一种名为Repilot的系统,这个系统能够使AI副驾驶在帮助程序员修复代码中的缺陷上更上一层楼。通过这种系统,AI不仅可以更好地理解程序员的问题,还可以为他们提供更准确、更具有针对性的解决方案...

Read More
2023-09-18 talkingdev

SyncDreamer开源,多视图合成技术进一步提升

近期,3D生成领域取得了飞速发展,其中,一个稳定且具有广泛应用前景的项目在GitHub Repo上获得了大量关注。这项工作被认为是最稳定且通用的。用户只需要输入一张图像,模型就能合成多个视图并生成相应的3D模型。这...

Read More
2023-09-18 talkingdev

马斯克警告参议员AI威胁,盖茨则表示该技术可解决全球饥饿问题

业界重量级人物如马斯克、盖茨和扎克伯格在一个私密会议中,就AI监管进行了讨论,讨论的焦点包括开源滥用和就业威胁等问题。他们一致认为,政府需要进行监管。马斯克警告全球参议员,AI技术可能带来的威胁不容忽视。...

Read More
2023-09-18 talkingdev

Adobe的Firefly生成AI模型现已全面开放并发布定价计划

Adobe的Firefly生成AI模型现已从测试阶段进入全面开放阶段,可以在Creative Cloud,Adobe Express和Adobe Experience Cloud中进行使用。用户将根据模型交互量通过'生成积分'进行计费。付费的Adobe方案包含各种积分数...

Read More
2023-09-15 talkingdev

AI技术助力医疗:从视网膜图像中检测眼病和帕金森病风险

科学家们已经开发出一款名为'RETFound'的AI工具,这款工具能够通过分析视网膜图像,诊断并预测患者发展多种健康问题的风险,包括眼部疾病、心力衰竭以及帕金森病。这是一项重大突破,将人工智能技术应用于医疗领域,...

Read More
2023-09-15 talkingdev

Coqui发布新一代文本转语音模型

科技公司Coqui近日公布了其新型文本转语音模型xtts的权重参数。该模型能够克隆语音参数,并能进行多语种的合成。此项技术的出现,无疑是对人工智能领域的一大贡献,预计将在语音合成、语音识别等多个应用领域发挥巨...

Read More
  1. Prev Page
  2. 580
  3. 581
  4. 582
  5. Next Page