漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-01 talkingdev

LLMs使用Dual Chunk Attention处理10万个令牌

Dual Chunk Attention(DCA)扩展了大型语言模型(如Llama2 70B)的能力,使它们能够处理超过100k个令牌而无需额外的训练。它将注意力计算分解成块,增强了模型对短期和长期上下文的理解。

Read More
2024-02-28 talkingdev

开源未来令牌增强自回归模型

该项目引入了回声嵌入,这是一种新的策略,通过将未来令牌信息纳入其中,克服了自回归模型的一个关键限制。这是通过将输入重复两次来实现的,这显著提高了基准任务的性能,同时与其他嵌入增强方法兼容。

Read More
2024-02-28 talkingdev

Meta或将在2024年晚些时候展示一款真正的AR智能眼镜

据悉,Meta可能会在今年晚些时候的Meta Connect活动上展示一款增强现实智能眼镜。该设备名为Orion,是一款真正的AR设备。公司内部存在很大压力来制作高质量的演示。公司内部人员现在正在尝试使用先进的原型机进行实...

Read More
2024-02-26 talkingdev

Marqo融资1250万美元,帮助企业构建生成式AI应用

向量搜索公司Marqo在由Lightspeed领导的A轮融资中筹集了1250万美元,以推进其下一代向量搜索平台的采用。Marqo的平台解锁了非结构化数据的巨大价值,覆盖了包括最终用户搜索、检索增强生成等关键企业应用,帮助企业...

Read More
2024-02-23 talkingdev

CrewAI:构建与编排Agent方式升级

CrewAI提供了一个库,用于构建和编排利用LangChain和Replit的AI代理。它提供了一个模块化的设置,包括代理、任务、工具和团队,可轻松集成到各种项目中。通过LangSmith简化调试,增强了对非确定性LLM调用的性能洞察...

Read More
2024-02-22 talkingdev

VLM开源:增强AI对抗攻击的防御能力

近日,GitHub推出了一项新的方法,可以增强OpenFlamingo和LLaVA等多模型模型对视觉对抗攻击的防御能力。该方法通过无监督地微调CLIP视觉编码器,有效地保护这些模型免受恶意图像攻击,提高了它们在现实应用中的可靠...

Read More
2024-02-16 talkingdev

Google发布Lumiere文本到视频模型

Google最近推出了一种新的文本到视频模型Lumiere,该模型可以将图像和风格作为输入,并使用一种新颖的“空时UNet”同时扩散所有内容。该模型采用了深度学习技术,可以将文本内容转换为相对应的视频,并且不需要任何人...

Read More
2024-02-13 talkingdev

Llmware:统一LLM应用程序开发框架

Llmware是一个统一的框架,用于开发基于LLM的应用程序模式,包括检索增强生成。它提供了一个通用的API,使得开发人员能够轻松地使用不同的LLM模型和数据集。Llmware还为开发人员提供了一组可自定义的工具,用于自动...

Read More
  1. Prev Page
  2. 56
  3. 57
  4. 58
  5. Next Page