目前使用的语言模型有两大类:密集型和稀疏型。密集型模型就像传统的2017年的变压器模型,每个令牌都使用每个模型参数。稀疏型模型在此后不久就被引入,它使用一种路由机制(通常是学习到的),这意味着每个令牌只使...
Read More最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...
Read More一项最新研究介绍了PerceptionCLIP,这是一种模拟人类视觉感知过程的两步图像分类方法,旨在更好地利用CLIP,一种突出的视觉语言模型。首先,通过识别背景属性并利用它们区分前景物体,这种新方法在图像分类任务中提...
Read More图像分割是一种将图像中属于对象的每个区域进行标记的过程,这比传统的分类问题要复杂得多。而且,如果没有预定义的对象列表,进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...
Read More近日,GitHub发布了一种名为Functionary的新型语言模型,这种模型具有解读和执行函数/插件的能力,可以准确地判断何时执行一个函数,并能理解其输出结果。Functionary只在需要的时候触发函数,从而大大提高了代码运...
Read More本文是对LLMs领域近几年发展的总结,旨在帮助行外人士了解LLMs是什么、可以用于什么、如何训练它们以及在使用它们时所面临的挑战,包括安全性、效果和伦理等方面。文章包含了演讲中的带有注释的幻灯片以及额外的笔记...
Read MoreJupyter AI将生成式人工智能引入到Jupyter中,为在笔记本中探索生成式人工智能模型和提高生产力提供了一种方式。Jupyter AI可以将Jupyter笔记本变成可复现的生成式人工智能游乐场。它拥有本地AI聊天功能,并支持多种...
Read More近日,GitHub在其官方仓库中发布了一款名为Color-Diffusion的全新着色模型,该模型的主要功能是给黑白图片进行着色。Color-Diffusion模型采用了先进的扩散技术,可以将色彩自然地分布到黑白图片的每个像素点上,实现...
Read More