漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-14 talkingdev

探索GenAI界面的替代UX模式

本文敦促UX设计师在GenAI界面中创新超越Quick Actions和Multi-Turn模式,强调需要更直观、适应性更强的设计来适应人工智能的不断发展。强调用户赋权和上下文理解,重点介绍了有前途的替代UX模式,如拖放、语音交互和...

Read More
2024-02-23 talkingdev

Lorax-多LoRA模型推理服务器开源

Lorax是一款支持将多个LoRA模型热插拔到单个基础模型上的推理服务器。这意味着在支持广泛的模型调整范围的同时,RAM内存占用会大幅减少。

Read More
2023-11-09 talkingdev

Langroid多智能体Agent编程框架开源

受 Actor 框架的启发,这个轻量级的 Python 库使得创建基于 LLM 动力的代理变得非常容易。Langroid 多智能体编程框架(Langroid multi-agent programming framework)最近发布了他们的 GitHub Repo,使得该项目的开...

Read More
2023-11-06 talkingdev

Talk Llama开源:在终端上与LLaMA AI对话

最近,一个名为Talk Llama的Github仓库备受关注,该仓库提供了一种在终端上与LLaMA AI进行交互的方式。LLaMA AI是一个基于GPT-3的自然语言处理模型,它的名字是“Language Model for Multi-turn Dialogue with Latent...

Read More
2023-10-23 talkingdev

SoM开源,多模态语言模型的新进展

多模态语言模型(multimodal language models)的发展正日益成熟。最近,一种名为State of Mark prompting的方法在GitHub Repo上引起了广泛关注。该方法首先使用Segment Anything算法对图像进行处理,对检测到的类别...

Read More
2023-10-06 talkingdev

深度解析:全面探讨分布式训练和高效微调的一切

在多GPU和多节点系统上训练语言模型存在多种挑战,且在这些场景下积累经验也非常困难。本篇博客文章详尽深入地研究了ZeRO,FSDP,以及在大规模训练或微调模型时可能遇到的问题。我们需要理解,进行分布式训练并不仅...

Read More
2023-10-04 talkingdev

论文:使多模态大型语言模型适应各种任务

多模态大型语言模型在许多任务中表现优秀,但在定位图像中的特定对象方面往往存在困难。为了改善这一问题,研究人员已经开发出一种新的方法:将物体的位置转化为文本,并通过特殊任务进行模型的训练。这种方法的出现...

Read More
2023-09-26 talkingdev

ChatGPT的全新升级:视觉、听觉和语音的全方位提升

ChatGPT正面临一次重大的模式升级,增加了多种新功能。不久的将来,用户将能够与模型进行语音交流,并得到模型的语音回应。此外,用户还可以上传图片并向ChatGPT提问有关图片的问题。这次升级使得ChatGPT在视觉、听...

Read More
2023-09-06 talkingdev

BLoRA开源,同一GPU上批量处理LoRAs

LoRAs是一种小型的参数适配器,通过插入到某些层次来改变底层模型的行为。你可以为基础模型进行批量生成,以提高性能。此外,你还可以对LoRA修改后的模型进行批量处理,并向不同的用户提供具有不同性能的模型。这种...

Read More
2023-09-05 talkingdev

论文:智能学习新系统,不间断地掌握多项任务

本文提出了一种新的系统,该系统可帮助模型在学习新任务的同时,不会忘记旧的任务。这是一种前沿的深度学习技术,主要解决了模型在学习新任务时往往会忘记旧任务的问题,这个问题在AI领域被称为灾难性遗忘。通过这种...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page