漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-02 talkingdev

开源的LangChain模板仓库

这些模板是一组参考架构,适用于各种流行的LLM用例,是构建生产就绪的LLM应用程序最简单和最快速的方法。

Read More
2023-11-01 talkingdev

COMM开源,改进多模态LLMs性能

近期,研究人员深入探究了多模态大型语言模型(MLLMs)中使用的视觉编码器,并发现CLIP和DINO模型中的某些特征特别适合于详细的视觉任务。他们随后引入了COMM,一种结合了两种模型优点的策略。COMM能够显著提高LLMs...

Read More
2023-10-31 talkingdev

微软研究小组开放GPT-3.5-turbo,参数达到20B

微软研究小组在一篇论文中提到,GPT-3.5-turbo(ChatGPT背后的模型)是一个具有20B参数的模型,该小组研究扩散模型用于代码。据称原始模型的参数为175B,因此可能进行了重新训练或蒸馏。

Read More
2023-10-31 talkingdev

探索现代LLM应用程序架构

本篇博客旨在为读者提供构建第一个LLM应用程序所需的一切知识。它还介绍了一些读者今天可以开始探索的问题空间。本博客涵盖了LLM应用程序的新兴架构以及LLM的现实影响。提供了进一步阅读的资源。

Read More
2023-10-27 talkingdev

基于稀疏深度细节的水下车辆实时深度估计模型开源

近日,一项名为‘Real-Time Depth Estimation for Underwater Vehicles’的研究成果在GitHub上发布。该研究提出了一种针对水下车辆的模型,可以通过结合稀疏深度细节从单个图像中实时估计深度。该模型是通过深度学习框...

Read More
2023-10-20 talkingdev

Fuyu-8B:面向AI Agent的多模态架构

HuggingFace 上现已推出 Fuyu-8B,这是一款专为数字代理设计的多模态模型。与其他多模态模型不同的是,它具有简化的架构,并支持任意图像分辨率,在不到 100 毫秒的时间内响应大图像。尽管针对特定应用程序,Fuyu-8B...

Read More
2023-10-19 talkingdev

论文:Zipformer一种新的语音识别Transformer模型

这项研究介绍了Zipformer,一种用于自动语音识别(ASR)的改进Transformer模型,它更快、占用更少内存,而且比广泛使用的Conformer效果更好。Zipformer是一种新型的语音识别模型,它使用了一种全新的架构,能够更快...

Read More
2023-10-19 talkingdev

BitNet新设计开源:更高效的语言模型架构

研究人员开发出BitNet,这是一种新的大型语言模型设计,使用更少的能量和内存。BitNet使用一种新的技术来平衡模型的准确性和计算效率,同时减少了对大量数据的依赖。这一新设计的目的是为了降低大型语言模型的计算成...

Read More
  1. Prev Page
  2. 61
  3. 62
  4. 63
  5. Next Page