漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-08 talkingdev

Cohere发布Command R+:面向企业的可扩展大型语言模型

Cohere公司近日推出了Command R+,这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型(LLM)。Command R+具备先进的检索增强生成功能,并支持引用,同时覆盖10种关键语言的多语言处理能力,以及工具使...

Read More
2024-04-08 talkingdev

Opera浏览器开发分支推出本地运行大型语言模型支持

Opera公司旗下的Opera One开发者浏览器近日宣布,现已支持本地运行150种不同的大型语言模型,这些模型来自50个不同的大型语言模型家族。用户无需连接互联网,即可在本地运行这些模型,但需先下载相应的模型文件。此...

Read More
2024-04-05 talkingdev

论文:LASP技术革新,高效管理语言模型中的长序列数据

Linear Attention Sequence Parallel(LASP)是一套新型策略,专为高效处理语言模型中的长序列而设计。该技术通过创新性地运用线性注意力机制,超越了传统方法,实现了对长序列数据的优化管理。LASP的核心优势在于其...

Read More
2024-04-04 talkingdev

生成式人工智能泡沫何时破灭?

生成式人工智能(Generative AI)的未来前景备受争议。目前,该技术面临着盈利能力不足、安全隐患以及语言模型固有的幻觉问题等多重挑战。除非在2024年底前发布一款像GPT-5这样具有突破性的模型,并解决关键问题同时...

Read More
2024-04-04 talkingdev

UPD开源-AI能否识别无解问题

近日,GitHub上出现了一个名为Unsolvable Problem Detection (UPD)的项目,旨在探索视觉语言模型中的一个新测试,即人工智能是否能识别出某些问题是无解的。这项技术的核心在于训练AI模型,使其能够区分可解和不可解...

Read More
2024-04-04 talkingdev

Opera推出本地运行大型语言模型的新功能

近日,知名浏览器Opera推出了一项创新功能,使用户能够在本地计算机上下载并运行大型语言模型(LLMs)。目前,该功能提供了超过150种不同的模型,涵盖50多个家族,为用户提供了前所未有的便利和灵活性。这些模型可以...

Read More
2024-04-03 talkingdev

HuggingFace团队揭示大规模合成数据在预训练模型中的应用

HuggingFace团队最近展示了如何为语言模型的预训练阶段生成、筛选、合成和扩展大量的合成数据。这一过程不仅涉及数据的生成,还包括对数据进行精心的筛选和过滤,以确保其在模型训练中的有效性和准确性。通过这种方...

Read More
2024-04-03 talkingdev

多模态大型语言模型SPHINX-V:提升人机交互新体验

近日,Draw-and-Understand项目推出了一款名为SPHINX-V的多模态大型语言模型。该模型通过视觉提示,旨在增强人与AI之间的互动交流。SPHINX-V结合了文本、图像与声音等多种信息输入,通过深度学习技术,实现了更加自...

Read More
  1. Prev Page
  2. 49
  3. 50
  4. 51
  5. Next Page