漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-22 talkingdev

MoME-提升多模态语言模型性能的新方法

研究人员提出了一种名为“多模态专家混合体” (MoME) 的方法,以解决通用的多模态大型语言模型(MLLMs)中的任务干扰问题。在多模态大型语言模型中,任务干扰是一个常见的问题,它可能会影响模型的性能和效率。MoME的提...

Read More
2024-07-22 talkingdev

苹果发布与Mistral竞争的7B参数模型

苹果公司最近公开了其最新的7B参数模型的所有内容,包括代码和数据。这个模型与Mistral相比具有竞争力。该模型是通过深度学习和机器学习的技术进行训练和开发的,其性能和效果显示出了苹果在人工智能领域的强大实力...

Read More
2024-07-22 talkingdev

论文:词汇规模的扩展定律新研究

根据最新的研究,更大规模的模型需要更大的词汇表。这项研究探讨了词汇规模的扩展定律,揭示了模型规模和词汇大小之间的关系。随着模型规模的增大,词汇表的规模也需要相应扩大。这是因为大型模型需要处理更多的情境...

Read More
2024-07-19 talkingdev

E5-V开源-全球多模态嵌入与LLMs

E5-V是一种新的框架,其改编了多模态大型语言模型(MLLMs)以创建全球多模态嵌入。通过使用提示,它弥补了不同输入类型之间的差距,而无需进行微调就实现了在多模态任务中的令人印象深刻的性能。这一全球多模态嵌入...

Read More
2024-07-19 talkingdev

超越传统向量基础RAG,用语言地图实现飞跃

在构建基于数据的聊天应用程序中,检索是非常重要的一部分。然而,系统对检索内容的格式通常十分敏感。构建内容的语言地图(例如,维基百科风格的词条),并使用该地图进行检索,可以显著提高聊天性能。Mutable AI就...

Read More
2024-07-19 talkingdev

OpenAI推出新款小型模型GPT-4o Mini,颠覆GPT-3.5

OpenAI近日推出了一款新型小型模型——GPT-4o Mini,目标是替代现有的GPT-3.5模型。GPT-4o Mini在MMLU(Mixed Multi-Level Understanding)上的得分为82,这对于低成本模型来说是相当合理的表现。OpenAI一直致力于开发...

Read More
2024-07-19 talkingdev

Mistral与Nvidia全新多语言模型Nemo 12B震撼发布

Mistral公司与Nvidia携手研发的全新多语言模型Nemo 12B已经正式发布。这款模型采用了全新的分词器进行训练,展现出了强大的多语言和英语处理能力。值得一提的是,Nemo 12B还支持128k的上下文。这种强大的性能,无疑...

Read More
2024-07-18 talkingdev

2024年的Prolog会是什么样子?

Prolog是一种编程语言,最初于1972年开发。它是一种基于逻辑的编程语言,旨在使程序员能够更轻松地处理复杂的关系和规则。在过去的几十年中,Prolog已经经历了许多变化和发展,但它是否仍然有用,仍然有人使用吗?在...

Read More
2024-07-18 talkingdev

Devzat – 一款优质的基于SSH协议的聊天工具,带来更多便利的使用体验

近日,一款基于SSH协议的聊天工具Devzat发布了,该工具提供了一系列质量优秀的生活特性,使用户可以更方便地使用SSH进行聊天。Devzat提供了多种语言支持,包括中文、英文、法文等,以及对多种操作系统的支持,包括Li...

Read More
2024-07-18 talkingdev

GraphRAG解析:索引如何提升RAG中知识图谱的性能

对微软的GraphRAG论文的分析揭示,像Neo4j这样的知识图谱在RAG应用的上下文检索中,可能并不会明显超过FAISS。尽管没有索引的Neo4j可以获得更高的答案相关性,但是边际收益可能无法证明投资的价值,考虑到ROI的限制...

Read More
  1. Prev Page
  2. 29
  3. 30
  4. 31
  5. Next Page