模型的相关内容 - 漫话开发者

2024-02-01 talkingdev

论文：苹果应用“Up captioning”技术，加快预训练收敛速度

苹果公司在人工智能系统中应用“Up captioning”技术来提高训练时的标签质量。该公司将此技术应用于预训练中，通过将C4重述为问题/答案对、指令等，加快了模型的收敛速度10倍，使模型的样本效率显著提高。但这也会增加...

2024-02-01 talkingdev

苹果正在为iOS 18准备重大的人工智能功能。它正在使用OpenAI的ChatGPT API进行内部测试，以开发自己的AI模型。iOS 17.4的第一个测试版揭示了一个新的SiriSummarization框架，它将AI集成到Messages应用程序中，实现了...

2024-02-01 talkingdev

2023年初，还没有公开的文本到视频模型可用，但现在有数十个在全球拥有数百万用户的活跃使用模型。虽然这些产品中的许多仍然存在限制，但过去一年的进展表明，这个行业即将发生巨大转变。本文将审视AI视频生成领域迄...

2024-02-01 talkingdev

WhisperKit是一个用Swift编写的开源库，它将OpenAI的Whisper语音识别模型与Apple的CoreML框架集成，以在Apple设备上进行高效的本地推理。它可以通过Swift Package Manager集成到Swift项目中。WhisperKit会自动下载推...

2024-02-01 talkingdev

本周，Mistral公司的CEO确认了Mistral的一个量化版本文件在HuggingFace上泄露，该技术使得在较弱的电脑和芯片上运行某些AI模型成为可能。据报道，该模型在EQ-Bench上超过了全球所有其他LLM模型，仅次于GPT-4。Mistra...

2024-01-31 talkingdev

研究人员通过在训练手部注释图像中添加三个额外通道，改善了生成模型（例如GAN和扩散模型）创建逼真手部图像的能力。这种方法利用了手部形态的先验知识，可以应用于许多手部相关的任务，例如手语翻译和手势识别。此...

2024-01-31 talkingdev

CreativeSynth是一种艺术图像编辑方法，通过无缝集成文本和图像输入来实现。其扩散模型配备了定制化的注意机制，能够精确地处理风格和内容，同时保留原始艺术作品的本质。为艺术家和设计师提供了一个全新的创作维度...

2024-01-31 talkingdev

不一致掩模(IM)是一种新的图像分割方法，即使只有有限的数据，也可以发挥作用。该方法在ISIC 2018数据集上进行了测试，击败了传统技术，甚至超过了在完全标记的数据集上训练的模型。