漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-22 talkingdev

MIT在应用数学规划的最新进展

应用数学规划作为一门重要的研究领域,近年来在优化算法、模型构建和实际应用方面取得了显著进展。通过引入先进的算法,如深度学习和强化学习,研究人员能够更有效地解决复杂的优化问题。这些技术的结合不仅提升了模...

Read More
2024-03-28 talkingdev

OPTIN框架:无需额外训练提升AI模型效率

OPTIN框架是一个创新的方法,用于提高基于变换器的AI模型在各个领域的效率,而无需进行重新训练。该框架采用了一种称为中间特征蒸馏的技术,可以在特定约束下压缩网络,同时几乎不影响其准确性。通过这种方法,可以...

Read More
2024-03-19 talkingdev

Anthropic发布高效的提示库,助力Claude 3模型任务执行

近期,人工智能研究公司Anthropic推出了Claude 3模型,受到广泛关注。与以往的模型相比,Claude 3在交互方式上有所不同,需要特定的提示风格来发挥其最大效能。为此,Anthropic精心收集并整理了一系列用户提示,这些...

Read More
2024-03-13 talkingdev

FastV: 优化视觉语言模型效率方法开源

该项目提出了一种改善大型视觉语言模型(例如LLaVA-1.5、QwenVL-Chat和Video-LLaVA)效率的方法,解决了“低效的注意力”问题。使用FastV这种新方法,通过修剪视觉令牌和学习自适应注意力模式来优化这些模型,从而显著...

Read More
2023-11-09 talkingdev

论文:跨视角训练提升小型语言模型效率

跨视角训练(SCT)可以提高小型语言模型的性能,使其能够生成先前仅可由较大模型实现的句子嵌入,从而优化性能和计算效率。

Read More
  1. Prev Page