BGE-M3项目介绍了一种多功能的嵌入模型,其在多功能性(密集、多向量和稀疏检索)、多语言性(支持100多种语言)和多粒度性(处理从短句子到长达8192个标记的文档输入)方面表现优异。它使用混合检索管道,结合不同...
Read MoreFireLlava是一个新的开源视觉模型,经过数据训练,可以用于商业任务。它与原始Llava的性能相当,但还没有达到Llava 1.5的水平。
Read More最新研究表明,长视频理解领域存在多粒度噪声对应问题,影响了视频语言研究的准确性。为了解决这一问题,研究人员开发了一种名为Norton的新方法,应用了最优传输算法来提高长期视频理解。该方法通过处理多粒度噪声对...
Read MoreMF-MOS是一种新模型,可以更好地使用LiDAR技术检测自动驾驶中的运动目标。该模型独特地分离运动和语义信息,使用残差图进行运动捕捉,使用距离图像进行语义引导。该模型的发布将进一步推动自动驾驶技术的发展。
Read MoreAI社区因HuggingFace和4chan分享的一个名为“miqu-1-70b”的泄漏大型语言模型而感到兴奋。该模型表现出能与OpenAI的GPT-4相媲美的性能,并与Mistral的Mixtral 8x7b有关。Mistral的CEO确认这是一位热情的客户泄露的,这...
Read MoreAccessKit为跨平台和编程语言提供UI可访问性基础设施。它具有一个数据模式,定义了使UI可供屏幕阅读器和其他辅助技术访问所需的所有数据。该模式主要基于Chromium的跨平台可访问性抽象,并定义了辅助技术可以请求的...
Read More近日,GitHub上一个名为Plock的Repo备受关注。该Repo提供了一种新的方法,可以让用户在任何可以输入文本的地方直接使用LLM。LLM是一种专业术语,代表着一种很强的自然语言处理技术。用户只需在输入框中输入相应的命...
Read More