漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-03 talkingdev

LISA开源:通过LLM进行推理分割

这项研究引入了一个名为“理性分割”的新AI任务,设计用于根据复杂和隐含的文本指令生成分割掩膜。此研究展示了一个名为LISA(Large-language Instructed Segmentation Assistant)的工具作为展示。LISA结合了大语言模...

Read More
2023-08-03 talkingdev

新研究提出‘聚焦线性注意力’方法,提升视觉变压器的效率与功效(GitHub Repo)

最新研究中,科研人员引入了一种名为‘聚焦线性注意力’的新方法,使变压器(Transformers)变得更为高效和强大。研究人员设计了新的映射函数和秩恢复模块,旨在在保持计算需求较低的同时,提升模型的性能。这一突破性...

Read More
2023-08-03 talkingdev

大型语言模型系统与产品的设计模式

本文讨论了将大型语言模型集成到系统和产品中的实用模式。它结合了学术研究、行业资源和从业者的专业知识。本文介绍了七种关键模式,涵盖了提高性能与降低成本/风险以及更接近数据与更接近用户之间的一系列模式。

Read More
2023-08-02 talkingdev

论文:自动音乐字幕系统取得显著成绩

为音乐产生人类可读的描述对于大多数系统来说都是一项挑战,甚至对于人类来说也相当困难!然而,凭借一些巧妙的数据采集和标签技术,研究人员成功地收集了一个涵盖各种音乐流派的2.2m字幕数据集。他们在此数据集上训...

Read More
2023-08-02 talkingdev

论文:ToolLlama-语言模型与API的强大结合

工具使用是一个范例,其中语言模型生成触发某些API被调用的词汇,其输出作为令牌被反馈到语言模型中。这意味着语言模型能够使用计算器,网络浏览器,甚至编码环境。随着最近强大的开源语言模型的发布,您可以收集40k...

Read More
2023-08-02 talkingdev

基于AI的舞蹈生成模型开源:塑造活灵活现的舞蹈影像

你是否曾经希望AI能够创作出真实且灵活的人类舞蹈视频?这正是DisCo模型所做的!它不仅能够保持人物主体和背景的外观,准确地跟随舞蹈姿势,而且还能适应它从未见过的新主体、背景和姿势。DisCo模型利用参考图像,精...

Read More
2023-08-02 talkingdev

Nvidia H100 GPUs: AI产业供需矛盾

人工智能产业的发展正受到GPU供应不足的制约。这种短缺导致产品推出和模型训练等方面受到各种限制。一旦供需平衡,事情就会加速发展。本文将探讨导致供需矛盾的原因,持续时间以及解决方法。

Read More
2023-08-02 talkingdev

PromptTools:自托管工具用于评估LLM和向量数据库

PromptTools是一套自托管工具,用于实验、测试和评估大型语言模型、向量数据库和提示。它允许开发者使用代码、笔记本和本地沙盒进行评估。开发者只需几行代码就可以测试不同模型上的提示和参数。PromptTools可以用于...

Read More
  1. Prev Page
  2. 388
  3. 389
  4. 390
  5. Next Page