LLM的相关内容 - 漫话开发者

2024-05-07 talkingdev

Cohere的Command R模型系列现已在亚马逊Bedrock平台上线

Cohere的Command R和R+是针对长文本任务优化的最新LLM（Large Language Models）。这两款模型在关键的商业重要能力方面表现优异。它们都是目前市场上的技术先行者，并且已经在亚马逊Bedrock平台上进行发布。这无疑是...

2024-05-07 talkingdev

研究人员已经开发出“Morph-Tokens”来提高AI的视觉理解和图像生成能力。这些令牌将用于理解的抽象概念转换为用于图像创建的详细视觉，利用MLLM框架的先进处理能力。Morph-Tokens的开发，不仅能够提高AI的图像理解和生...

2024-05-07 talkingdev

Unsloth.ai的创始人近期发布了一段视频，详述了他们的团队如何使用PyTorch，编写他们的内核，以及设计他们的API界面。Unsloth的框架和库功能强大，易于使用。Unsloth通过这种方式，使得大量的开发者能够更好地进行深...

2024-05-06 talkingdev

企业级AI平台Lamini使企业内的软件团队能够开发出新的LLM能力，减少对专有数据的幻觉，安全地从云VPCs到现场运行他们的LLM，并通过模型评估来扩大他们的基础设施，这些模型评估优先考虑ROI和业务成果而非炒作。Lamin...

2024-05-06 talkingdev

苹果公司即将在iOS 18中，为Safari、Spotlight Search和Siri增强AI相关功能。Safari的其中一个关键功能是文本摘要。 Siri也将获得类似的更新，使其能够以简化的方式生成响应来传递消息的内容。苹果的AI模型将完全在...

2024-05-03 talkingdev

一项最新的研究揭示了一种能够显著扩展语言模型上下文长度至128K的方法。这项研究强调了大量和多样性的训练数据的重要性。语言模型的上下文长度是语言模型理解和生成连贯文本的能力的一个重要因素。此项新的研究方法...

2024-05-01 talkingdev

最近，GitHub仓库上新增了一款名为Phospho的文本分析平台。这款平台主要针对LLM应用进行文本分析，提供了一种全新的处理文本数据的方法。Phospho可以帮助开发者处理大量的文本数据，提取有用的信息，并进行深度分析...

2024-05-01 talkingdev

QUICK是一套新的优化CUDA内核，通过解决内存问题，提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升，使AI模型运行更快，效率更高。QUICK的出现，无疑为AI领域带来了新的可能性，通过优化内存处理方式...