Llamafile是一种自包含的可执行文件,可以在任何平台上直接运行模型。它的最新更新带来了两倍的速度提升,以及在可移植性方面的显著改进。这意味着用户可以更快地运行和处理复杂的数据模型,无需担心不同平台之间的...
Read MoreTrackGPT集成了大规模视觉-语言模型的能力,以变革物体追踪的方式。TrackGPT能够理解用于追踪的隐含指令,从而使过程更加流畅,提升性能。这一点在新的InsTrack基准和其他具有挑战性的数据集上表现出了令人印象深刻...
Read More2024年3月的最后一周,开源大型语言模型(LLMs)迎来了一次重要的时刻。包括Databricks的DBRX,A21 Labs的Jamba和SambaNova Systems的Samba-CoE在内的多款模型相继发布。这些发布标志着开源AI模型多样化和普及化的关...
Read MoreMaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM),完全使用Python/Jax编写,目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开,充分展示了其强大的功能和优秀的性能。MaxTex...
Read MoreSakana AI近日发布了EvoSDXL-JP,这是一款为日语指令优化的高速图像生成模型,采用了一种革新的模型融合方法。与现有模型相比,EvoSDXL-JP的推断速度提高了十倍,并且性能卓越。这款模型非常适合在日本的教育领域使...
Read MoreLlama3是一种革命性的新技术,它通过使用Unsloth进行微调,可以在保持相同的计算效率的同时,显著降低VRAM的使用量。最近的研究表明,使用Unsloth微调Llama3可以使上下文长度增长六倍,这比HF的flash attention技术...
Read More在神经架构搜索(NAS)的创新工作中,引入了一种图神经网络(GNN)预测器,这种预测器可以提高识别特定任务的最优神经网络配置的效率。GNN预测器通过理解神经网络的图结构,从而可以更有效地预测神经网络的性能,这...
Read MoreMIM4D 是一种全新的方法,通过使用双重遮罩图像建模在自动驾驶中提升视觉表现学习。这种方法从多视角视频中捕获空间和时间的详细信息,大大提升了自动驾驶的性能和效率。MIM4D 的开源代码已经在GitHub上发布,对于自...
Read More多模态模型Bunny系列是一套强大的开放模型,尤其在MMMU基准测试中,其性能表现优秀。这是该团队基于Llama3 8B发布的首款开放模型。这个系列的模型采用了SigLIP与Llama3的技术,充分展示了其强大的性能和应用广泛性。...
Read More近日,GitHub上发布了一个名为tiny-gpu的项目,这是一个基于Verilog实现的最小化GPU。该项目的主要优化方向是帮助用户从头开始学习GPU的工作原理。tiny-gpu尝试通过最简单的方式,将GPU的操作和结构进行模拟和实现,...
Read More