FlexiFilm 是一种专门为生成超过30秒的长视频而设计的扩散模型,它能够保证生成的视频具有高度的一致性和质量。这一新模型的出现,将在视频制作领域开启新的可能性。视频长度不再受限,而且模型生成的视频质量也得以...
Read MoreFlorence 2是一个小型视觉模型,完全基于onnx和WebGPU在浏览器中运行。WebGPU是一种新型的Web标准,为Web应用程序提供高效的低级图形和计算功能。这种模型旨在帮助开发者更好地理解和利用WebGPU的性能优势。Onnx则是...
Read More本项目介绍了一种使用自我监督学习模型提高智能手机上图像分辨率的方法,该模型能够改善基于参考的超分辨率(RefSR)。通过使用自我监督学习模型,我们能够有效地提升智能手机摄影的图像质量和分辨率,使得拍摄出来...
Read MoreSEMamba是一款全新的语音增强系统,它利用了Mamba状态空间模型来提高语音信号的清晰度。这款语音增强系统的主要目标是通过去噪和清晰的语音信号处理,来提高人们的语音识别和理解。SEMamba系统具有高度的灵活性,能...
Read MorePTQ4SAM是一个新的框架,旨在减少大规模Segment Anything Model(SAM)的内存和计算需求。SAM是一个全新的大规模模型,但其大规模的特性也使得其在实际应用中面临着严峻的挑战,尤其是在内存和计算资源上的需求。而P...
Read MoreCELLO是一种全新的数据集,包含了14,094个因果问题,旨在提升AI对因果关系理解的能力,超越了常识推理的层次。这个数据集的构建,旨在推动AI技术在处理更复杂问题时,具有更深沉的因果关系理解。由此,可以有效提升...
Read MoreUIST是一种创新的方法,通过将密集嵌入转换为用户和项目表示的紧凑、离散的令牌,显著地改善了点击率预测。不同于传统的持续嵌入方法,UIST将嵌入空间离散化,使得模型能够捕捉到更加细粒度的特征。此外,这种离散化...
Read More近日,Meta发布了其多标记预测模型。据悉,该模型在Hugging Face Hub上的表现非常强劲。这款模型采用高级算法进行数据预测,能够同时处理多个标记,提高了预测的准确性和效率。对于个人和企业用户来说,这款多标记预...
Read More