漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-10 talkingdev

ALOHA机器人模拟系统开源

ALOHA机器人系统以其令人难以置信的烹饪和家务任务演示在互联网上引起了轰动。它使用了许多有趣的训练技术(主要是模仿学习)。该代码库包含了ALOHA系统的一些基线训练算法,用于模拟。

Read More
2024-01-10 talkingdev

开源LLM Gateway,实现多语言模型之间的路由

Portkey AI最近开源了LLM Gateway,实现了多个不同语言模型之间的路由。这个开源项目旨在简化在不同的语言模型之间进行选择和路由的过程,从而更好地利用不同模型的优势,提高语言模型的整体性能。 LLM Gateway是一...

Read More
2024-01-09 talkingdev

用提示增强的视觉语言模型开源

这项项目介绍了一种方法,可以适应各种任务的类似CLIP的视觉语言模型,同时保留其泛化能力。该方法从LLM数据中学习提示,避免了需要标记图像的需求。

Read More
2024-01-09 talkingdev

DiffusionEdge,最新边缘检测模型开源

DiffusionEdge是一种新颖的边缘检测模型,它集成了扩散概率模型,可以在资源有效的同时提供更准确和清晰的边缘图。传统的边缘检测模型对于噪声和边缘不清晰的情况表现得不够稳定。DiffusionEdge的扩散模型可以帮助减...

Read More
2024-01-09 talkingdev

AI现状及2024年预测

本文分享了关于AI现状的思考,以及对该技术发展方向的一些预测。文章主要关注AI模型的产品、市场和人才现状,而并未涉及AI架构和基础设施的技术细节。今年,开源模型将赶上专有模型,并帮助推动边缘设备的推理。

Read More
2024-01-08 talkingdev

ODTrack开源,改进视频追踪系统

ODTrack是一个新的视频追踪系统,改进了我们在视频中跟踪物体的方式。与老旧系统在连接过去和未来的视频帧时存在困难不同,ODTrack使用一种称为'在线令牌传播'的方法来更好地连接连续的视频帧。通过这种方法,ODTrac...

Read More
2024-01-08 talkingdev

开源项目RAG atouille用于检索管道的研发

Retrieval Augmented Generation(RAG)是一种将外部知识融入语言模型生成中的方法。RAGatouille库允许训练和研究最先进的RAG系统。它简化了研究人员的工作,使其能够更轻松地构建检索管道,并将其应用于语言生成领...

Read More
2024-01-08 talkingdev

HuggingFace与Stability AI合作开源复现MUSE

MUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型,并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长,但它们显示出了很...

Read More
  1. Prev Page
  2. 136
  3. 137
  4. 138
  5. Next Page