漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-13 talkingdev

AI工具CAT-ViL:实现手术视频的可视化解答

本文介绍了一种深度学习工具——CAT-ViL,该工具能够对手术视频进行详细的解答并进行可视化。这是一项实质性的创新,将极大地帮助医学生和初级外科医生的学习和实践。通过CAT-ViL工具,用户可以通过查询特定的手术步骤...

Read More
2023-07-08 talkingdev

InternLM公开7亿参数的基础聊天模型,专为实际场景设计

近日,InternLM在GitHub上公开了一款专为实际场景设计的基础聊天模型。该模型拥有7亿的参数,可广泛应用于各种实际场景,如客户服务、在线咨询等。InternLM的这款模型采用了先进的深度学习技术,能够理解和回应用户...

Read More
2023-07-04 talkingdev

人脑活动的潜在扩散模型实现高分辨率图像重建

研究人员提出了一种新的方法,使用一种扩散模型,具体来说是一种名为稳定扩散的潜在扩散模型(LDM),从通过fMRI捕获的人脑活动中重建高分辨率、高保真度的图像。该方法在保持生成性能的同时减少了计算成本,无需对...

Read More
2023-06-30 talkingdev

ChatLaw:开源的中文法律语言模型

本研究介绍了ChatLaw,这是一个专门为中国法律语言设计的开源语言模型,旨在助力该领域的数字化转型。ChatLaw基于深度学习技术,经过大量的法律文本训练,能够理解和生成法律相关的语言。它可以帮助律师、法官和学者...

Read More
2023-06-23 talkingdev

FlagAI:快速、易用且可扩展的大规模通用人工智能模型工具包开源

FlagAI(Fast Large-scale General AI models)是一个快速、易于使用且可扩展的大规模模型工具包。它提供了一整套功能强大的工具和库,用于开发和部署大规模人工智能模型。FlagAI的设计目标是使开发人员能够快速构建...

Read More
2023-06-15 talkingdev

Audiocraft发布PyTorch库,用于音频生成的深度学习研究

Audiocraft是一个PyTorch库,用于音频生成的深度学习研究,其中包含了最先进的可控文本转音乐模型MusicGen的代码。 ### 核心要点: - Audiocraft是一种用于音频生成的PyTorch库。 - Audiocraft包含最新的可控文本...

Read More
2023-06-14 talkingdev

一键制作深度伪造视频,Roop (GitHub Repo)火了!

近日,GitHub上一个名为Roop的仓库备受关注,该仓库提供了一键制作深度伪造视频的功能,引起了广泛关注。 该仓库的特点如下: - 一键制作:只需要上传一张照片,Roop就可以自动将照片中的人脸替换成视频中的演员或...

Read More
2023-06-14 talkingdev

"AlgoPerf"新基准测试系统可有效提高深度学习算法训练效率(GitHub Repo)

研究人员提出了竞争性基准测试系统"AlgoPerf",旨在公平评估各种深度学习算法的训练效果,并为未来的改进奠定基础。这一研究解决了比较和改进深度学习训练算法的挑战,这些算法是加速数据处理、节省资源和创建准确模...

Read More
  1. Prev Page
  2. 34
  3. 35
  4. 36
  5. Next Page