本研究介绍了LLM4SGG弱监督场景图生成方法,该方法利用大型语言模型的能力,从图像标题中更好地提取和对齐关系,解决了图像标题中捕获详细关系和利用所有可用信息的挑战。
Read More近日,HuggingFace diffusers轻量快速推理引擎在GitHub上线。该引擎通过许多小改进,实现了大幅提升推理速度的目标,声称每秒可达60步,比原来的23步快了许多。该引擎在自然语言处理任务中表现优异,受到了许多开发...
Read More近日,一项名为 Character-LLM 的项目在 GitHub 上推出。该项目通过训练大型语言模型,以贝多芬和凯撒大帝等历史名人为蓝本,通过为它们提供特定的人物资料,从而模拟这些历史人物的语言风格和思想特征。这一技术的...
Read More在自然语言处理领域,语言模型已经取得了重大的突破,但是在数学领域,语言模型的应用却相对较少。Llemma是一种面向数学的开放式语言模型,它基于GPT-3模型,可以处理数学领域的自然语言文本,如数学公式、定理和证...
Read More随着虚拟现实和增强现实技术的发展,实时的高分辨率图像合成变得越来越重要。美国科罗拉多州立大学的研究人员提出了一种名为4K4D的技术,它可以在4K分辨率下实现实时的4D视图合成。4K4D技术使用了一种新型半透明光场...
Read MoreCal.ai是一款开源人工智能日历调度系统。这个系统可以帮助用户更加智能地安排日程。通过使用机器学习和自然语言处理技术,Cal.ai可以理解用户的日程安排和优先级,并自动安排会议和事件。Cal.ai还可以学习用户的日常...
Read More虽然华尔街投资者很难评估和理解Meta开源的AI方法,但是科技行业中的许多人认为,将Llama定位为类似于Linux的做法是一个聪明的选择。Meta的方法是基于AI拼图的开发,这种方法将AI分解成许多小块,使其更容易理解和开...
Read MoreLibgen是许多封闭模型中的数据集。虽然这个数据集的商业使用合法性存在争议,但研究人员仍在使用它来更好地了解语言模型训练数据质量。这个开源的GitHub代码库旨在将Libgen转换为txt文本文档的形式,以便更方便地进...
Read MoreMosaicFusion是一款神奇的工具,可以创建许多对象的新图片,而无需任何先前的学习。它分两步完成:首先制作图片,然后创建一个遮罩,显示每个对象的位置。
Read More