漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-01 talkingdev

Lambda Labs训练Open Sora视频模型,一键生成乐高电影

Lambda Labs最近在其1-click集群上训练了一个名为Open Sora的视频模型,用于制作乐高电影。这一技术的出现,不仅改变了乐高动画制作的传统方式,也为AI技术在创新应用中开辟了新的道路。利用这一模型,制作者可以方...

Read More
2024-06-27 talkingdev

玩具反斗城携手AI技术,打造首支Sora文本到视频广告片

玩具反斗城(Toys “R” Us)与广告代理Native Foreign合作,利用OpenAI的文本到视频工具Sora,创作了一部品牌影片。这部影片通过AI生成的视频片段,讲述了公司创始人的故事。Sora自2月份推出以来,尚未对公众开放。该...

Read More
2024-06-19 talkingdev

多视图图像赋能3D表征学习:Duoduo CLIP模型发布

近日,一款名为Duoduo CLIP的3D表征学习模型引起了业界的广泛关注。与传统的3D表征学习模型不同,Duoduo CLIP采用多视图图像,而非点云数据作为输入。这种独特的设计,使得Duoduo CLIP在3D表征学习的效果上,可能会...

Read More
2024-06-04 talkingdev

PPAD:基于CLIP的胸部X光异常检测研究

该研究探讨了如何利用CLIP(Contrastive Language-Image Pre-training)方法进行胸部X光片的异常检测。CLIP是一种新兴的多模态学习方法,它通过对图像和文本的联合训练,实现了在多个任务中的优异表现。在本研究中,...

Read More
2024-05-02 talkingdev

论文:CLIP预训练的Mamba模型,零样本图像分类的新标杆

近日,一个全新的Mamba模型引起了工业界的广泛关注。该模型通过使用对比性语言-图像预训练(CLIP)的方式进行训练,展现出在零样本图像分类任务上的出色效率和性能。据了解,零样本分类任务一直是计算机视觉领域的一个...

Read More
2024-05-01 talkingdev

一个CLI工具用来创建无需构建配置的网页扩展程序

一位开发者最近开发了一个CLI工具,可以帮助用户无需构建配置就能创建网页扩展程序。这个工具可以帮助开发者快速创建浏览器扩展程序,而且用户无需担心构建配置问题。这个工具可以在不同的浏览器中运行,包括Chrome...

Read More
2024-04-30 talkingdev

Whisper-cli:可本地部署的开源语音识别系统

近日,Ruff的开发团队发布了一款名为Whisper cpp cli的全新语音识别系统,该系统已在GitHub Repo上开源。这是一款完全自主研发的语音转文字系统,基于Whisper技术构建。Ruff团队一直以创新技术和高品质服务闻名于业...

Read More
2024-03-29 talkingdev

3D医学成像数据集与AI框架CT-CLIP开源

CT-RATE是一个将3D医学成像与文本报告相结合的数据集,旨在提供更丰富的医学影像信息。与此同时,CT-CLIP作为一个多功能的人工智能框架,已经针对这些图像进行了优化处理。该框架能够更好地理解和分析医学成像数据,...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page