深度学习的相关内容 - 漫话开发者

2024-07-04 talkingdev

手把手教你解决Torch Compile问题，提升代码运行速度

对于使用Torch Compile的开发者来说，解决其过程中遇到的错误问题可能是一项挑战。本教程将详细介绍如何解决Torch Compile中的错误，帮助您的代码更快运行。首先，我们需要了解深度学习框架中的编译过程，这对于找到...

2024-07-01 talkingdev

Mosaic团队已与PyTorch合作，撰写关于如何扩展他们的MoEs模型至数千个GPU的文章。MoEs，全称Mixture of Experts，是一种深度学习的模型结构，其核心思想是将复杂的问题分解为若干个相对简单的子问题，然后由专家系统...

2024-06-28 talkingdev

本次调查深入探讨了生成信息检索（GenIR），这是一种全新的信息查找方式，它摒弃了传统的搜索方法，转而采用能够实时生成答案的方法。生成信息检索不再依赖于现有的数据库或信息源，而是依赖于先进的算法和技术，如...

2024-06-26 talkingdev

研究人员已经发现，通过分类数据、预计算嵌入以及动态生成示例，可以使LLM语音助手更加高效和可扩展。他们利用RAG（Retrieval Augmented Generation）系统对语音助手进行优化，提高了其性能和扩展性。RAG是一种典型...

2024-06-26 talkingdev

近日，AI与Morph Labs联合发布了一篇关于信息检索增强型生成（RAG）模型微调的优秀博客文章。在文章中，他们展示了一些合成数据的使用情况。信息检索增强型生成模型是一种新型的深度学习模型，它结合了信息检索技术...

2024-06-25 talkingdev

在2024年CVPR（计算机视觉与模式识别）会议中，我们精心策划了一份计算机视觉领域的论文清单。这些论文涵盖了计算机视觉的各个方面，包括深度学习、物体检测、图像识别、语义分割等。每篇论文都代表了该领域的最新研...

2024-06-20 talkingdev

近日，知名的开源平台GitHub上的Paramount项目公开了一项新的技术——LLMs（Large Language Models）的Agent精度测量。该技术旨在提升大型语言模型的代理精度，助力开发者更加准确地评估和优化模型性能。据了解，LLMs...

2024-06-20 talkingdev

Logit Lens方法已经得到了增强，该方法通过分解logit输出，帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流，注意力层和MLP层，揭示了这些部分如何影响预测，并为gemma-2b模型执行的诸如...