大型语言模型的相关内容 - 漫话开发者

2023-10-20 talkingdev

FACTCHD：检测LLM中的事实错误的基准测试

研究人员推出了FACTCHD，这是一个基准测试，旨在检测像ChatGPT这样的大型语言模型在复杂情况下产生事实错误的信息。

2023-10-19 talkingdev

研究人员开发出BitNet，这是一种新的大型语言模型设计，使用更少的能量和内存。BitNet使用一种新的技术来平衡模型的准确性和计算效率，同时减少了对大量数据的依赖。这一新设计的目的是为了降低大型语言模型的计算成...

2023-10-18 talkingdev

本研究介绍了LLM4SGG弱监督场景图生成方法，该方法利用大型语言模型的能力，从图像标题中更好地提取和对齐关系，解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

2023-10-18 talkingdev

近日，一项名为 Character-LLM 的项目在 GitHub 上推出。该项目通过训练大型语言模型，以贝多芬和凯撒大帝等历史名人为蓝本，通过为它们提供特定的人物资料，从而模拟这些历史人物的语言风格和思想特征。这一技术的...

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...

2023-10-11 talkingdev

研究人员正在探究数据增强技术对提高大型语言模型（LLMs）数学推理能力的影响。他们通过增强现有数据集中的查询，创建了一个新的数据集AugGSM8K，并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...

2023-10-11 talkingdev

研究人员推出了一种名为FAVOR的新方法，该方法通过在帧级别精细融合音频和视觉细节，使大型语言模型能够理解视频。FAVOR方法的推出，为大型语言模型的视频理解能力提供了新的发展空间。这种新方法通过在帧级别精细融...

2023-10-11 talkingdev

研究员们创造了一款名为AucArena的模拟平台，旨在在拍卖环境中测试大型语言模型。这些环境是动态的，需要策略性思考。初步测试显示，如果给出合适的提示，这些模型可以在拍卖中表现出色，表现出诸如预算和长期计划等...