漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-02 talkingdev

论文:研究者引入新的异常检测问题,聚焦场景特定的“奇异”对象

最近,研究者提出了一种新的异常检测问题,该问题针对的是相对于场景中其他对象的“奇异”对象。与传统方法不同,这里的异常情况是场景特定的,并通过多个视点进行识别。这种方法不仅能增强异常检测的准确性,也能帮助...

Read More
2024-07-02 talkingdev

UnSAM-无监督SAM自动图像分割技术开源

无监督SAM(UnSAM)是一种新型的全图像分割模型,它消除了对人工注释的需求。UnSAM通过结合自上而下和自下而上的聚类方法,识别视觉场景中的层次结构,采用一种分而治之的方法。在复杂的视觉场景中,这种方法可以更...

Read More
2024-07-02 talkingdev

深度探索:用muP扩展规模

这是一篇关于在扩展模型和数据集大小时调整超参数的极好且易于理解的文章。在大数据时代,如何有效地处理和分析庞大的数据集,是当前科技行业面临的一大挑战。本文主要介绍了使用muP进行规模扩展的技术方法。muP是一...

Read More
2024-07-01 talkingdev

深入探讨:训练MoEs模型

Mosaic团队已与PyTorch合作,撰写关于如何扩展他们的MoEs模型至数千个GPU的文章。MoEs,全称Mixture of Experts,是一种深度学习的模型结构,其核心思想是将复杂的问题分解为若干个相对简单的子问题,然后由专家系统...

Read More
2024-07-01 talkingdev

MUMU视觉模型:强势引领图像和文本的交织生成

MUMU视觉模型是一种创新的生成图像模型,它的特点在于能够将文本和图像交织在一起进行更强的条件化处理。这种独特的方法使得MUMU视觉模型在性能上超越了纯文本条件化模型。MUMU视觉模型的核心优势在于,它不仅仅是将...

Read More
2024-06-27 talkingdev

RES-Q-代码库编辑能力的新评估标准

RES-Q是一个全新的评估工具,专门用来评估大型语言模型在根据自然语言指令编辑代码库的能力。这个评估标准的出现,为开发者提供了一个全新的工具,可以更准确地评估和比较不同语言模型在代码编辑方面的性能。RES-Q的...

Read More
2024-06-27 talkingdev

论文:利用检索增强指令调整进行命名实体识别

检索增强指令调整(RA-IT)通过大型语言模型对信息进行提取,从而提高了信息提取的效率。这种技术的出现,为我们理解和处理大量信息提供了新的可能。RA-IT不仅可以提高信息提取的速度,还可以提高提取信息的准确性,...

Read More
2024-06-26 talkingdev

EvalAlign:一种文本到图像生成模型评估指标

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同,EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是,EvalAlign不...

Read More
2024-06-24 talkingdev

程序员不应轻信任何人,包括他们自己

编程抽象让我们的思维更加高效,但对于那些在困难项目上只掌握表层知识的程序员来说,成功是难以实现的。这些项目往往伴随着已知的解决方案并涉及多个领域的专业知识。在技术领域,信任自己或他人的抽象是危险的,因...

Read More
2024-06-23 talkingdev

利用语义熵检测大型语言模型中的幻觉

随着大型语言模型的普及,越来越多的人开始依赖这些系统来生成语言内容。然而,这些系统可能会出现所谓的幻觉,即生成的内容与真实世界不符合。为了解决这个问题,研究人员提出了一种名为语义熵的新方法来检测幻觉。...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page