大型语言模型的相关内容 - 漫话开发者

2024-05-27 talkingdev

Claude 3 Sonnet AI模型内在工作机制揭秘

一项新的研究论文详细揭示了AI模型Claude 3 Sonnet的内部工作机制，展示了如何通过激活与金门大桥等概念相关的“特征”来影响模型的反应。通过调整这些特征的强弱，研究人员能够引导Claude的回答包含特定元素，展示了...

2024-05-24 talkingdev

近年来，大型语言模型在自然语言处理领域取得了显著进展，但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题，研究人员提出了一种新的方法：Streaming Infinite Retentive LLM（SirLLM）。这种方法允...

2024-05-22 talkingdev

Braindump是一款革命性的AI工具，它允许开发者通过简单的文本提示来构建俯视视角/2.5D游戏或交互式虚拟世界。这项技术可以自动生成3D模型、游戏数据和脚本，从而将用户的创意构想转化为生动的游戏内容。本文总结了Br...

2024-05-22 talkingdev

智能专家系统是一种利用大型语言模型（LLMs）进行文本分类的新方法。该系统通过减少对广泛的预处理和领域专业知识的需求，大大简化了文本分类过程。LLMs具备强大的自然语言处理能力，能够更高效地理解和分类复杂的文...

2024-05-21 talkingdev

近日，知名的语音识别和自然语言处理技术提供商SoundHound的AI聊天助手宣布将与Perplexity进行合作。Perplexity是一家专注于提供精准、最新的网络查询回应的公司，其技术在搜索引擎、聊天机器人等领域有着广泛应用。...

2024-05-13 talkingdev

E2URec是一种全新的方法，可以让基于大型语言模型的推荐系统高效、有效地“遗忘”用户数据，保证用户隐私的同时，又不牺牲系统性能。这种新方法以用户隐私保护为核心，通过改变推荐系统的学习机制，实现对用户数据的有...

2024-05-13 talkingdev

语言模型依赖于单独训练的标记生成器。这些标记生成器可能会产生在语言模型训练过程中从未见过的标记。即使在最强大的现代语言模型中，也存在许多此类标记。本文探讨了这种现象，并提出了识别和处理这些标记的方法。...

2024-05-10 talkingdev

预测多个令牌的同时生成是当前被积极研究的一个有趣的范式。如果成功，这将大大提高许多大型语言模型的生成速度。本篇文章中的方法，模仿了图像合成中的一致性模型，试图在精调的LLMs上使用并行解码策略来加快生成速...