苹果公司在人工智能系统中应用“Up captioning”技术来提高训练时的标签质量。该公司将此技术应用于预训练中,通过将C4重述为问题/答案对、指令等,加快了模型的收敛速度10倍,使模型的样本效率显著提高。但这也会增加...
Read More苹果正在为iOS 18准备重大的人工智能功能。它正在使用OpenAI的ChatGPT API进行内部测试,以开发自己的AI模型。iOS 17.4的第一个测试版揭示了一个新的SiriSummarization框架,它将AI集成到Messages应用程序中,实现了...
Read More2023年初,还没有公开的文本到视频模型可用,但现在有数十个在全球拥有数百万用户的活跃使用模型。虽然这些产品中的许多仍然存在限制,但过去一年的进展表明,这个行业即将发生巨大转变。本文将审视AI视频生成领域迄...
Read MoreWhisperKit是一个用Swift编写的开源库,它将OpenAI的Whisper语音识别模型与Apple的CoreML框架集成,以在Apple设备上进行高效的本地推理。它可以通过Swift Package Manager集成到Swift项目中。WhisperKit会自动下载推...
Read More本周,Mistral公司的CEO确认了Mistral的一个量化版本文件在HuggingFace上泄露,该技术使得在较弱的电脑和芯片上运行某些AI模型成为可能。据报道,该模型在EQ-Bench上超过了全球所有其他LLM模型,仅次于GPT-4。Mistra...
Read More研究人员通过在训练手部注释图像中添加三个额外通道,改善了生成模型(例如GAN和扩散模型)创建逼真手部图像的能力。这种方法利用了手部形态的先验知识,可以应用于许多手部相关的任务,例如手语翻译和手势识别。此...
Read MoreCreativeSynth是一种艺术图像编辑方法,通过无缝集成文本和图像输入来实现。其扩散模型配备了定制化的注意机制,能够精确地处理风格和内容,同时保留原始艺术作品的本质。为艺术家和设计师提供了一个全新的创作维度...
Read More不一致掩模(IM)是一种新的图像分割方法,即使只有有限的数据,也可以发挥作用。该方法在ISIC 2018数据集上进行了测试,击败了传统技术,甚至超过了在完全标记的数据集上训练的模型。
Read More