ALOHA机器人系统以其令人难以置信的烹饪和家务任务演示在互联网上引起了轰动。它使用了许多有趣的训练技术(主要是模仿学习)。该代码库包含了ALOHA系统的一些基线训练算法,用于模拟。
Read More去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5(即使它可能是3倍大小)。有关模型训练,令牌计数,模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器,它使用自...
Read MoreTransformer是自然语言处理中非常重要的模型,但对于初学者来说可能有些困难。然而,这篇文章提供了一个非常好的介绍,对于具有基本数学和Python技能的人来说非常易于理解。作者详细解释了Transformer的工作原理,并...
Read More本文深入探讨了如何打造一种具有人类思维过程的人工智能。在过去的几十年中,人工智能一直是计算机科学领域的一个热门话题。尽管现在已经有了许多成功的应用程序,但我们远远没有达到完全模拟人类思维过程的目标。本...
Read MorePykoi是一个开源的Python库,旨在通过RLHF(Reinforcement Learning with Hamiltonian Flows)提高LLMs(Latent Linear Models)的性能。Pykoi是一个基于TensorFlow 2的库,提供了一系列的LLMs和RLHF的实现,可以直...
Read More