漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-30 talkingdev

星链计划:颠覆太空行业的先锋卫星群

五年前,SpaceX旗下的星链计划成功将首批60颗卫星送入轨道,至今已经发射了超过6,500颗卫星,使其成为在役的最大卫星星座。星链计划不仅在数量上取得了显著成就,更在技术创新上引领了太空行业的新潮流。其卫星的发...

Read More
2024-05-28 talkingdev

Llama 3-V: 用价值500美元和100倍小的模型匹配GPT4-V

近日,计算机科学家们推出了一款名为Llama 3-V的新型人工智能模型,其与GPT4-V性能相当,但模型大小只有GPT4-V的1/100。与GPT4-V的高昂价格相比,Llama 3-V仅需500美元即可获得。这款新型模型可以应用于自然语言处理...

Read More
2024-05-28 talkingdev

Scribble2Scene:提升3D场景补全效率的新方法

Scribble2Scene是一种针对语义场景补全的新方法,显著减少了对繁琐标注的需求。传统的3D场景补全技术通常需要大量的数据标注,这不仅耗时费力,而且成本高昂。然而,Scribble2Scene通过利用简单的涂鸦和稀疏的标注就...

Read More
2024-05-27 talkingdev

LoRA-Ensemble:提升自注意力网络的预测精度

LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配(LoRA)的应用,通过隐式集成实现了在不增加传统集成方法高计算成本的情况下,仍能做出准确且校准良好的预测。这种方法不仅在精...

Read More
2024-05-24 talkingdev

论文:GLSCL提升文本视频检索效率

研究人员开发了一种新的方法——全局-局部语义一致学习(Global-Local Semantic Consistent Learning,简称GLSCL),以提升文本视频检索的效率。这一创新方法不仅提高了检索的准确性,还显著降低了计算成本。GLSCL通过...

Read More
2024-05-21 talkingdev

LeMeViT:通过可学习元令牌加速视觉Transformer

LeMeViT是一种新的方法,通过使用可学习元令牌来降低视觉Transformer的计算成本。这些元令牌能够高效地捕捉关键信息,从而显著提高推理速度。与传统的视觉Transformer相比,LeMeViT在保持高精度的同时,大幅减少了计...

Read More
2024-05-21 talkingdev

论文:LeMeViT利用可学习的元Token实现快速视觉变换器

最近,一种名为LeMeViT的新方法用于降低视觉变换器中的计算成本,其核心策略是使用可学习的元令牌。这些令牌能够有效地捕获关键信息,从而提高推理速度。视觉变换器在计算机视觉领域有着广泛的应用,然而其计算成本...

Read More
2024-05-17 talkingdev

轻巧的视觉语言模型:Xmodel-VLM开源

Xmodel-VLM是一种针对消费级GPU服务器优化的视觉语言模型。为解决高昂的服务成本限制了大规模多模态系统的应用,这个10亿规模的模型采用了LLaVA范式进行模态对齐。这是一种新的方法,它优化了视觉和语言之间的协同工...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page