虚拟试穿任务,即将一图像上的衣物转移到另一图像,尤其在更高分辨率下,这项任务具有挑战性。许多方法使用生成对抗网络(GAN)。然而,本文介绍的解决方案DCI-VTON,采用了一种结合了样例基础修复和变形模块的扩散...
Read MoreDoctorGPT,这款领先的语言模型(LLM),已经能够通过美国医疗执照考试。它的特点是可以离线工作,跨平台运行,且能保护用户的健康数据私密性。这款开源的AI医生,将为医疗行业带来革命性的改变,使得医疗服务更具普...
Read More虽然段落任意模型(SAM)在各种数据集的分割任务中表现优异,但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性,有效地分割食品图像,甚至识别出场景中的单个食品和其他...
Read MoreIBM与Hugging Face正在向公众发布IBM的地理空间基础模型,该模型使用NASA的卫星数据进行构建。这个模型是IBM与NASA的合作成果,旨在推动AI在气候科学和地球研究中的作用,解决处理大型环境数据集的挑战。该模型已经...
Read MoreLLaMA.cpp的崛起令许多人感到惊讶。为什么一台普通的MacBook能够以稍慢于A100的速度运行最先进的模型呢?答案在于,当你一次只处理一个批次,一个标记的时候,内存带宽就成了瓶颈。而M2的内存带宽与A100的之间的差距...
Read MoreMeta发布了MyoSuite 2.0系列,该项目将机器学习应用于生物力学控制问题。MyoSuite平台包括一系列基准肌肉骨骼模型和任务供研究人员尝试。模仿人体运动是非常复杂的。这项研究有助于开发更有能力的机器人和逼真的元宇...
Read More本文介绍了在编码或专业工作之外,大型语言模型的日常应用。这些应用包括将模型用于整理购物清单、总结书籍笔记、查询字典、将任务转化为子任务以及作为编辑器。文章还介绍了一些大型语言模型不太适用的方面,如生成...
Read MoreStack Exchange的知识库采用了Creative Commons许可证,这意味着任何人都可以以任何方式使用它,甚至可以用于商业目的。其中一大部分与编程相关的数据被AI模型吸收。本文探讨了Stack Exchange的使用情况以及公开引入...
Read More