学习的相关内容 - 漫话开发者

2024-05-09 talkingdev

ChemFlow：利用先进的生成模型探索化学空间

ChemFlow是一个新的框架，旨在通过使用深度生成模型高效地导航化学空间，从而提高分子科学的效率。这种新型框架的出现，使化学研究人员能够在化学空间中更加精准地进行探索和导航，从而为分子科学领域的研究和发展开...

2024-05-09 talkingdev

QoQ，一种新型量化算法，通过使用4位权重、8位激活和4位KV缓存，加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术，它能够减少模型的存储需求和计算复杂性。在这种情况下，QoQ算法采用了较低精度的数...

2024-05-08 talkingdev

传统上，搜索和推荐一直被分开，因为虽然它们在概念上占据了同一光谱的两端，但它们具有不同的工具、架构和机器学习目标。大型语言模型引入了需要小心管理的期望，因为在开放式解决方案空间中引导客户意图是很困难的...

2024-05-07 talkingdev

像GPT-4V这样的视觉-语言模型在理解和与图像和文本交互方面正在快速发展。然而，最近的一项研究揭示了它们在视觉推理上的重大限制。研究人员使用复杂的视觉难题，如智商测试中的难题，来测试这些模型，并发现它们在...

2024-05-07 talkingdev

DeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2，其中激活参数达到210亿。无论是在编码还是推理方面，该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型，但无疑，...

2024-05-07 talkingdev

Unsloth.ai的创始人近期发布了一段视频，详述了他们的团队如何使用PyTorch，编写他们的内核，以及设计他们的API界面。Unsloth的框架和库功能强大，易于使用。Unsloth通过这种方式，使得大量的开发者能够更好地进行深...

2024-05-06 talkingdev

谷歌近日发布了一份新的数据集，包含了1.5万张极其详细和全面标注的图像。这个数据集的特点在于其精确度和全面性，每张图像都进行了详尽的标注，提供了丰富且精确的数据资源，为研究人员提供了强大的工具，可以用于...

2024-05-06 talkingdev

近日，JAX库的新成员Penzai亮相。Penzai通过具有可读性的功能Pytree结构，使得对训练模型的操纵和理解变得更加容易。这个库包含了丰富多样的工具，可以用于模型的可视化、调试以及组成部分分析。Penzai的安装和使用...