漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-21 talkingdev

Nvidia发布Mamba 2新模型

Nvidia最近在一篇论文中突出介绍的混合简易Mamba模型已经发布。这款模型采用了混合模型的设计理念,结合了多种算法和技术,以实现更高效的数据处理和分析。Nvidia一直致力于推动AI技术的发展,Mamba 2模型的发布,无...

Read More
2024-06-21 talkingdev

GeoBench深度和单目几何模型标准突破

一项新的基准测试对当前先进的深度和表面法线估计模型进行了评估。这个基准测试将在众多模型中筛选出表现最优秀的,为研究者和开发者提供参考。这一进步对于提升计算机视觉技术,尤其是在深度感知和三维建模方面,具...

Read More
2024-06-21 talkingdev

遥感变化检测技术进步:ChangeViT助力大规模环境变化检测

最近,一种名为ChangeViT的框架引起了科技界的广泛关注。该框架采用视觉变压器(ViTs)进行遥感图像中大规模环境变化的检测。遥感技术作为一种非接触式获取地球表面信息的手段,在环境监测、气候变化研究等领域有着重...

Read More
2024-06-21 talkingdev

Anthropic推出高效视觉模型Claude 3.5 Sonnet,性能超越Opus

Anthropic最近推出了一款名为Claude 3.5 Sonnet的新型视觉模型。Claude 3.5 Sonnet在性能上超越了Opus,而且成本只有Opus的五分之一。这款模型目前是市场上最优秀的视觉模型,颠覆了前沿模型的性能标准。Claude 3.5...

Read More
2024-06-20 talkingdev

开源Dot:让本地LLMs和TTS/RAG交互更便捷

近日,一个名为Dot(GitHub Repo)的开源应用引起了大家的关注。这是一个独立的开源应用,其主要目的是让用户更轻松地使用本地LLMs(语言模型)和RAG(重新生成的注意力引导)来与文档和文件进行交互。这种交互方式...

Read More
2024-06-20 talkingdev

TroL-高效大型语言和视觉模型开源

近日,一种名为TroL的新型高效大型语言和视觉模型 (LLVMs) 在GitHub上发布,其模型规模分别为18亿、38亿和70亿参数。这些模型能够精确地处理和理解大量的语言和图像信息,其性能和效率都达到了非常高的水平。这些模...

Read More
2024-06-20 talkingdev

论文:LLMs决策制定者

决策QA是LLMs的一项新任务,它能够基于复杂的数据分析来确定最佳的决策。在传统的决策制定过程中,我们需要人工对大量数据进行分析,这不仅耗时耗力,而且可能由于人为因素导致决策的偏差。而现在,LLMs的出现,让决...

Read More
2024-06-20 talkingdev

微软发布全新顶尖视觉模型Florence-2

微软最近发布了一套名为Florence-2的MIT许可的小型视觉语言模型(VLMs)。这套模型在图像标注、边界识别和分类等任务上,表现出色,大大超过了许多体型更大的模型。Florence-2模型的发布,标志着微软在人工智能和机...

Read More
  1. Prev Page
  2. 65
  3. 66
  4. 67
  5. Next Page