漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-13 talkingdev

VideoMamba视频方案所有代码和模型开源

VideoMamba是一种解决视频理解复杂性的解决方案,它通过高效地管理本地冗余和全局依赖性来实现。该项目的创建者宣布,他们已经将代码和模型全部发布到GitHub上供公众使用。这个开源项目将提高人工智能在视频理解上的...

Read More
2024-03-13 talkingdev

V3D开源-视频扩散模型增强3D生成技术

这个项目引入了一种新颖的方法,通过单个图像生成高质量、详细的3D物体,增强了3D物体的生成。该方法基于视频扩散模型,利用深度学习技术从单个视角的2D图像生成高质量的3D模型。此方法可应用于各种领域,如游戏制作...

Read More
2024-03-12 talkingdev

xAI的语言模型Grok将于本周开源

据Elon Musk在X上透露,xAI的语言模型Grok将在未来几天内开源。 Grok是xAI的一项重要技术,它基于深度学习技术,能够快速地处理自然语言,并在文本中找到有意义的信息。Grok已经在xAI内部使用了很长时间,现在将会对...

Read More
2024-03-11 talkingdev

Axolotl开源,本地GPU上训练大模型取得突破

上周,在小型GPU上训练大型模型取得了突破。这个配置展示了如何使用这些技术在消费级硬件上训练Mixtral。

Read More
2024-03-11 talkingdev

Hatchet:开源队列和发布/订阅系统,解决并发性等问题

Hatchet是GitHub开源的代码库,可以帮助开发者更好的设计耐用的工作负载,解决传统队列和发布/订阅系统所带来的一系列问题,如并发性、公平性和速率限制等。Hatchet通过对任务进行分组,并使用定时器和状态机等技术...

Read More
2024-03-08 talkingdev

多头注意力实现基准测试开源

近代LML中常用的多头注意力模块的不同实现之间的速度存在近10倍的差异。本笔记本展示了其中几个实现,并对其性能进行了基准测试。

Read More
2024-03-08 talkingdev

Fructose: 基于LLM调用的可靠强类型接口

近期,开源社区发布了一个名为Fructose的Python包,其主要用途是为LLM调用创建可靠强类型接口。 Fructose是一个轻量级Python包,它可以帮助开发人员避免与LLM交互时的一些常见错误,例如类型不匹配或缺失参数。通过...

Read More
2024-03-08 talkingdev

深入探讨:大规模模型训练的并行化技术

这是一篇关于大规模模型训练的并行化技术的教程。文章详细介绍了不同类型的并行化技术,以及如何在训练大模型时实现高效的并行化。本文介绍了数据并行、模型并行和混合并行等不同的技术,并详细讨论了它们的优缺点。...

Read More
  1. Prev Page
  2. 175
  3. 176
  4. 177
  5. Next Page