近日,一项新的研究挑战了结合监督微调和强化学习的训练方法的有效性。研究表明,在初始训练中使用更先进的模型(如GPT-4)可以优于更复杂的两步方法。这一研究的开源代码已经发布到GitHub上,供科研人员使用和参考...
Read More近日,一种名为ChartX的新工具发布在GitHub上,用于测试多模态大语言模型(MLLM)在解释和推理可视化图表方面的能力。ChartX通过评估模型对图表的理解能力来测试其多模态能力,包括语言和视觉。该工具可以评估多种不...
Read MoreGoogle已经发布了其Gemma 2B和7B参数模型的权重,可通过HuggingFace获得。这些模型是仅解码器的Transformer,训练了2T和6T个令牌。它们在各种基准测试中都比Llama 2表现出色,并提供基础和指令调整版本。
Read MoreBluesky是一个联邦社交网络,最初由Twitter的杰克·多西(Jack Dorsey)资助的项目,现在允许任何人运行自己的服务器。其分散式模型使用与Mastodon不同的协议。联邦允许用户托管自己的数据和帐户并制定自己的规则。随...
Read More亚马逊AGI研究人员开发了一种名为“具有新兴能力的大适应流式TTS”(BASE TTS)的语言模型,它在对话文本中表现出“最先进的自然度”,展示了它没有专门训练的语言技能。
Read More近日,开源项目BoCoEL在GitHub上发布。BoCoEL是一个用于准确评估LLMs的工具,采用贝叶斯优化方法,能够从大量的LLMs中找到最佳的架构和超参数组合。BoCoEL可以帮助研究者更快地训练出高效的LLMs,提高模型的准确性和...
Read More近期,AI领域的重大进展,特别是谷歌的Gemini提供了超过一百万标记的上下文窗口,以及Groq的硬件使得GPT-3.5模型的响应几乎是即时的,这标志着AI应用迈入了实践时代,同时也凸显了领袖们理解和适应快速演变的AI应用...
Read More知名研究员Nicholas Carlini发布了他用于评估大型语言模型性能的基准。有趣的是,它让GPT-4的表现在大多数其他基准之上。据了解,这个基准是基于多个指标和任务,包括自然语言推理和问答等。
Read More