漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-19 talkingdev

Anthropic发布高效的提示库,助力Claude 3模型任务执行

近期,人工智能研究公司Anthropic推出了Claude 3模型,受到广泛关注。与以往的模型相比,Claude 3在交互方式上有所不同,需要特定的提示风格来发挥其最大效能。为此,Anthropic精心收集并整理了一系列用户提示,这些...

Read More
2024-03-13 talkingdev

FastV: 优化视觉语言模型效率方法开源

该项目提出了一种改善大型视觉语言模型(例如LLaVA-1.5、QwenVL-Chat和Video-LLaVA)效率的方法,解决了“低效的注意力”问题。使用FastV这种新方法,通过修剪视觉令牌和学习自适应注意力模式来优化这些模型,从而显著...

Read More
2023-11-09 talkingdev

论文:跨视角训练提升小型语言模型效率

跨视角训练(SCT)可以提高小型语言模型的性能,使其能够生成先前仅可由较大模型实现的句子嵌入,从而优化性能和计算效率。

Read More
  1. Prev Page