漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-17 talkingdev

AI末日论者终于遭到应有的反击

曾经宣称AI将毁灭我们所有人的人现在不得不重新审视自己的立场了。“AI末日论”仅仅只有对大公司有利,而在AI领域正在发生的开源运动中存在着丰富的机遇。

Read More
2023-11-17 talkingdev

a16z:生成式人工智能如何改变音乐产业

生成式人工智能创作的音乐可能成为我们所消费的音乐或帮助我们塑造听音乐的习惯的未来,这可能成为音乐的“中途之旅时刻”。生成式人工智能在音乐创作中的应用越来越广泛,它能够创造出全新的音乐作品,同时也能够根据...

Read More
2023-11-17 talkingdev

如何在树莓派上运行LLMs

最近有人在一只填充的鹦鹉上装上了Mistral的7B型号,这在网上引起了轰动。本文深入探讨了他们用来使其运行的基本思想。

Read More
2023-11-17 talkingdev

视频帧插值技术Distance Indexing进一步提升视频质量

本项目引入一种名为“distance indexing”的新方法,以改进传统的视频帧插值技术(VFI),该技术通常难以准确预测物体的运动。这种方法通过向模型提供有关物体在帧之间移动的距离的明确信息,来明确学习目标并减少模糊...

Read More
2023-11-17 talkingdev

DeepMind最新气象预测模型开源

DeepMind近年来一直在研究气象预测。其最新模型基于图神经网络,对于10天的预测非常准确。DeepMind发布了代码和权重,让用户可以在本地运行(如果有卫星数据)。该模型的预测准确度是当前最高水平。

Read More
2023-11-17 talkingdev

阿里云发布Qwen Audio通用音频转语言模型

阿里云近日发布了Qwen Audio模型,该模型是一款通用的音频转语言模型,能够用于音乐、语音等多种任务。该模型基于深度学习技术,经过大量数据训练,能够准确地识别语音,并将其转化为对应的语言文字,为用户提供更加...

Read More
2023-11-17 talkingdev

论文:直接偏好优化提高模型的真实性

根据偏好优化模型是促进ChatGPT普及的突破之一。类似的技术也可以用来提高模型的正确性和真实性,将医学回忆中的错误减少50%以上。

Read More
2023-11-17 talkingdev

论文:智能眼镜上的物体检测技术

该团队创建了一个新的面向视觉的RISC-V硬件,并训练了一个超小的YOLO计算机视觉模型,实现了低功耗和极低延迟的实时物体检测。该技术可广泛应用于智能眼镜、自动驾驶、智能家居等领域。

Read More
  1. Prev Page
  2. 841
  3. 842
  4. 843
  5. Next Page