模型的相关内容 - 漫话开发者

2024-04-29 talkingdev

Llamafile速度提升，性能提升一倍

Llamafile是一种自包含的可执行文件，可以在任何平台上直接运行模型。它的最新更新带来了两倍的速度提升，以及在可移植性方面的显著改进。这意味着用户可以更快地运行和处理复杂的数据模型，无需担心不同平台之间的...

2024-04-29 talkingdev

近日，Meta推出了全新的Llama模型预训练框架——Torchtitan。该框架是完全使用PyTorch编写的，具有高度的灵活性和易用性。对于广大的PyTorch用户和开发者来说，这是一个利好消息。Meta是全球最大的社交网络公司，其在...

2024-04-29 talkingdev

Luminal 是一款基于深度学习的开源框架，它在GitHub上发布并得到了广泛的关注。这个框架以速度和简单性为出发点，把快速和简易性放在首位，让用户可以在最短的时间内实现深度学习模型的快速构建和部署。Luminal能够...

2024-04-29 talkingdev

TrackGPT集成了大规模视觉-语言模型的能力，以变革物体追踪的方式。TrackGPT能够理解用于追踪的隐含指令，从而使过程更加流畅，提升性能。这一点在新的InsTrack基准和其他具有挑战性的数据集上表现出了令人印象深刻...

2024-04-29 talkingdev

研究人员近日推出了一种名为PLLaVA的新模型，该模型通过采用独特的池化策略，使得图像-语言人工智能模型能够适应视频任务。在众多已有的图像-语言模型中，PLLaVA以其全新的应用方式和技术策略，展现出了强大的潜力和...

2024-04-29 talkingdev

本文展示了链式思考（CoT）可以通过'...'代币进行混淆。这需要训练模型，但表明可能无法解读CoT步骤，模型可以隐藏思考过程。链式思考是一种新兴的人工智能技术，通过模拟人类思考过程，提高机器学习模型的决策质量...

2024-04-28 talkingdev

2024年3月的最后一周，开源大型语言模型（LLMs）迎来了一次重要的时刻。包括Databricks的DBRX，A21 Labs的Jamba和SambaNova Systems的Samba-CoE在内的多款模型相继发布。这些发布标志着开源AI模型多样化和普及化的关...

2024-04-28 talkingdev

MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM)，完全使用Python/Jax编写，目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开，充分展示了其强大的功能和优秀的性能。MaxTex...