漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-08 talkingdev

Meta开源新模型训练优化器代码,无需LR调度

Meta的研究团队近日推出了一款新型的优化器,并已在X平台上公开代码及其多种集成方式。这款优化器的独特之处在于它不依赖于学习率(LR)调度,训练过程中无需预先设定总步数。经过实证,该优化器在包括语言模型在内...

Read More
2024-04-02 talkingdev

英伟达TensorRT更新,性能提升达28倍,Llama 2基准测试每秒处理1200个令牌

英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新,这一更新使得AI推理速度大幅提高,达到了比基线快28倍的速度。特别是在Llama 2的基准测试中,能够达到每秒处理1200个令牌的惊人速度。这一进步得益...

Read More
2024-03-25 talkingdev

大数据最优传输理论:全面阅读清单开放

最优传输理论是数学和计算领域的一个丰富分支,主要研究概率分布之间的距离。此GitHub仓库提供了一个全面的阅读清单,旨在提高最优传输在速度和准确性上的扩展性。该清单包括了最优传输理论的基础知识、数学原理、算...

Read More
2024-03-13 talkingdev

Transformer Debugger: 为小型语言模型提供自动可解释性技术支持

Transformer Debugger是一种工具,它通过将自动可解释性技术与稀疏自动编码器相结合,支持对小型语言模型的特定行为进行调查。

Read More
2024-03-08 talkingdev

CoLLM-通过协作提高LLM性能

Co-LLM推出了一种新方法,可以让大型语言模型协作,逐标记生成文本。这种策略允许模型利用其独特的优势和专业知识来完成各种任务,从而在遵循指令、特定领域问题和推理挑战等方面提高性能。

Read More
2024-03-04 talkingdev

探索LLMa的视频理解技术

这个仓库包含了一系列有用的资源,重点是大型语言模型在视频理解领域的应用。这些资源包括论文、代码和数据集,可以帮助研究人员和工程师更好地理解和应用LLMa模型。LLMa模型是一种基于自然语言处理的技术,在视觉和...

Read More
2024-02-27 talkingdev

R2R:快速部署生产级RAG系统的框架

R2R是一个半正式框架,旨在快速部署生产级RAG系统。它旨在弥合实验性RAG模型和生产就绪系统之间的差距。R2R为在生产环境中部署、适应和维护RAG管道提供了简单的路径。现已提供短视频演示。

Read More
2024-02-22 talkingdev

GausO-用4张照片生成高质量3D物体

该仓库提供了一种方法,可以利用四张照片生成高质量的3D物体,采用的是高斯平面填充技术。该技术可以将照片中的物体转化为点云,再通过高斯平面填充算法生成3D物体。这种方法不需要大量的照片和设备,可以在普通相机...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page