Cohere公司近日推出了Command R+,这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型(LLM)。Command R+具备先进的检索增强生成功能,并支持引用,同时覆盖10种关键语言的多语言处理能力,以及工具使...
Read MoreOpera公司旗下的Opera One开发者浏览器近日宣布,现已支持本地运行150种不同的大型语言模型,这些模型来自50个不同的大型语言模型家族。用户无需连接互联网,即可在本地运行这些模型,但需先下载相应的模型文件。此...
Read MoreLinear Attention Sequence Parallel(LASP)是一套新型策略,专为高效处理语言模型中的长序列而设计。该技术通过创新性地运用线性注意力机制,超越了传统方法,实现了对长序列数据的优化管理。LASP的核心优势在于其...
Read More生成式人工智能(Generative AI)的未来前景备受争议。目前,该技术面临着盈利能力不足、安全隐患以及语言模型固有的幻觉问题等多重挑战。除非在2024年底前发布一款像GPT-5这样具有突破性的模型,并解决关键问题同时...
Read More近日,GitHub上出现了一个名为Unsolvable Problem Detection (UPD)的项目,旨在探索视觉语言模型中的一个新测试,即人工智能是否能识别出某些问题是无解的。这项技术的核心在于训练AI模型,使其能够区分可解和不可解...
Read More近日,知名浏览器Opera推出了一项创新功能,使用户能够在本地计算机上下载并运行大型语言模型(LLMs)。目前,该功能提供了超过150种不同的模型,涵盖50多个家族,为用户提供了前所未有的便利和灵活性。这些模型可以...
Read MoreHuggingFace团队最近展示了如何为语言模型的预训练阶段生成、筛选、合成和扩展大量的合成数据。这一过程不仅涉及数据的生成,还包括对数据进行精心的筛选和过滤,以确保其在模型训练中的有效性和准确性。通过这种方...
Read More近日,Draw-and-Understand项目推出了一款名为SPHINX-V的多模态大型语言模型。该模型通过视觉提示,旨在增强人与AI之间的互动交流。SPHINX-V结合了文本、图像与声音等多种信息输入,通过深度学习技术,实现了更加自...
Read More