LLM的相关内容 - 漫话开发者

2024-05-10 talkingdev

CLLM一致性语言模型：开创新的预测范式

预测多个令牌的同时生成是当前被积极研究的一个有趣的范式。如果成功，这将大大提高许多大型语言模型的生成速度。本篇文章中的方法，模仿了图像合成中的一致性模型，试图在精调的LLMs上使用并行解码策略来加快生成速...

2024-05-10 talkingdev

llm-ui是一个React库，用于大型语言模型，允许开发人员向输出添加自定义组件。该库可以通过npm安装并导入到React项目中，使得开发人员可以使用自己的组件来定制模型的输出。llm-ui还提供了一些默认的组件来展示模型...

2024-05-09 talkingdev

QoQ，一种新型量化算法，通过使用4位权重、8位激活和4位KV缓存，加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术，它能够减少模型的存储需求和计算复杂性。在这种情况下，QoQ算法采用了较低精度的数...

2024-05-09 talkingdev

Consistency LLM是一种新的自然语言处理模型，可以将其转换为并行解码器，从而将推理时间缩短至3.5倍。LLM模型是一种具有良好性能的模型，但推理速度较慢。该研究团队将LLM转换为并行解码器，使用了一种名为一致性训...

2024-05-08 talkingdev

传统上，搜索和推荐一直被分开，因为虽然它们在概念上占据了同一光谱的两端，但它们具有不同的工具、架构和机器学习目标。大型语言模型引入了需要小心管理的期望，因为在开放式解决方案空间中引导客户意图是很困难的...

2024-05-07 talkingdev

Cohere的Command R和R+是针对长文本任务优化的最新LLM（Large Language Models）。这两款模型在关键的商业重要能力方面表现优异。它们都是目前市场上的技术先行者，并且已经在亚马逊Bedrock平台上进行发布。这无疑是...

2024-05-07 talkingdev

研究人员已经开发出“Morph-Tokens”来提高AI的视觉理解和图像生成能力。这些令牌将用于理解的抽象概念转换为用于图像创建的详细视觉，利用MLLM框架的先进处理能力。Morph-Tokens的开发，不仅能够提高AI的图像理解和生...

2024-05-07 talkingdev

Unsloth.ai的创始人近期发布了一段视频，详述了他们的团队如何使用PyTorch，编写他们的内核，以及设计他们的API界面。Unsloth的框架和库功能强大，易于使用。Unsloth通过这种方式，使得大量的开发者能够更好地进行深...