漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-02 talkingdev

RAM遵循长度约束指令:模型调优新方法

在众多的模型中,大多数都不能遵循长度要求,例如少于40个词。然而,最近的研究显示,我们可以通过调优使它们达到这样的要求。这项工作的关键在于调整模型的参数,使其能够根据要求生成特定长度的输出。这一发现可能...

Read More
2024-07-02 talkingdev

AI扩展的神话揭秘

LLM通过仅扩展就能达到AGI的未来潜力是不太可能的。虽然扩展已经显示出对模型能力的改善,但它主要增强的是复杂性,而不是新出现的能力。获取高质量的训练数据变得越来越具有挑战性。我们需要理清一个关于AI扩展的误...

Read More
2024-07-02 talkingdev

论文:研究者引入新的异常检测问题,聚焦场景特定的“奇异”对象

最近,研究者提出了一种新的异常检测问题,该问题针对的是相对于场景中其他对象的“奇异”对象。与传统方法不同,这里的异常情况是场景特定的,并通过多个视点进行识别。这种方法不仅能增强异常检测的准确性,也能帮助...

Read More
2024-07-02 talkingdev

改进推理效率的Block Transformer

这个代码库引入了一种新型的Transformer变压器,其KV缓存大小大幅度减少。虽然尚未在大规模上得到证实,但理论上,它可以匹配常规变压器的性能。这意味着,我们现在有了一种新的工具,可以在处理复杂的计算问题时,...

Read More
2024-07-02 talkingdev

UnSAM-无监督SAM自动图像分割技术开源

无监督SAM(UnSAM)是一种新型的全图像分割模型,它消除了对人工注释的需求。UnSAM通过结合自上而下和自下而上的聚类方法,识别视觉场景中的层次结构,采用一种分而治之的方法。在复杂的视觉场景中,这种方法可以更...

Read More
2024-07-02 talkingdev

Composio:赋能Agent,挑战复杂任务

Composio,这是一个在GitHub Repo上的项目,其主要目标是为Agent提供精心制作的工具,使他们能够处理复杂的任务。这些工具不仅易于使用,而且具有高度的灵活性和可定制性。Agent在使用这些工具时,可以更加有效地完...

Read More
2024-07-02 talkingdev

论文:以10亿人格特征来创建合成数据的新方法

近期,一项新的研究将网络文本视为来自某种“人格”,并以此作为条件,显著提高了下游任务的性能。研究人员发现,在数学领域,这种方法使性能提升了20个百分点。这项研究的方法是通过大规模网络文本数据,创造出约10亿...

Read More
2024-07-02 talkingdev

Web2Code开源-网页代码生成的新流程

研究人员已经开发出一种新的流程,以改进Web2Code指令调谐。这个过程涉及到创建新的网页图像-代码配对,优化现有的网页代码生成数据,创建新的文本问题-回答配对,以及优化现有的网页理解数据。这个新进程的开发,不...

Read More
  1. Prev Page
  2. 369
  3. 370
  4. 371
  5. Next Page