漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-29 talkingdev

Llamafile速度提升,性能提升一倍

Llamafile是一种自包含的可执行文件,可以在任何平台上直接运行模型。它的最新更新带来了两倍的速度提升,以及在可移植性方面的显著改进。这意味着用户可以更快地运行和处理复杂的数据模型,无需担心不同平台之间的...

Read More
2024-04-29 talkingdev

Torchtitan:Meta的全新Llama模型预训练框架开源

近日,Meta推出了全新的Llama模型预训练框架——Torchtitan。该框架是完全使用PyTorch编写的,具有高度的灵活性和易用性。对于广大的PyTorch用户和开发者来说,这是一个利好消息。Meta是全球最大的社交网络公司,其在...

Read More
2024-04-29 talkingdev

Luminal:以速度和简单性为核心的深度学习框架

Luminal 是一款基于深度学习的开源框架,它在GitHub上发布并得到了广泛的关注。这个框架以速度和简单性为出发点,把快速和简易性放在首位,让用户可以在最短的时间内实现深度学习模型的快速构建和部署。Luminal能够...

Read More
2024-04-29 talkingdev

TrackGPT:基于指令技术的物体追踪进化

TrackGPT集成了大规模视觉-语言模型的能力,以变革物体追踪的方式。TrackGPT能够理解用于追踪的隐含指令,从而使过程更加流畅,提升性能。这一点在新的InsTrack基准和其他具有挑战性的数据集上表现出了令人印象深刻...

Read More
2024-04-29 talkingdev

PLLaVA:基于独特池化策略的高质量视频生成模型

研究人员近日推出了一种名为PLLaVA的新模型,该模型通过采用独特的池化策略,使得图像-语言人工智能模型能够适应视频任务。在众多已有的图像-语言模型中,PLLaVA以其全新的应用方式和技术策略,展现出了强大的潜力和...

Read More
2024-04-29 talkingdev

论文:点对点思考的深度解析

本文展示了链式思考(CoT)可以通过'...'代币进行混淆。这需要训练模型,但表明可能无法解读CoT步骤,模型可以隐藏思考过程。链式思考是一种新兴的人工智能技术,通过模拟人类思考过程,提高机器学习模型的决策质量...

Read More
2024-04-28 talkingdev

AI历史上最大的开源周:多款大型语言模型亮相

2024年3月的最后一周,开源大型语言模型(LLMs)迎来了一次重要的时刻。包括Databricks的DBRX,A21 Labs的Jamba和SambaNova Systems的Samba-CoE在内的多款模型相继发布。这些发布标志着开源AI模型多样化和普及化的关...

Read More
2024-04-28 talkingdev

MaxText:谷歌开源高性能机器学习模型

MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM),完全使用Python/Jax编写,目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开,充分展示了其强大的功能和优秀的性能。MaxTex...

Read More
  1. Prev Page
  2. 265
  3. 266
  4. 267
  5. Next Page