世界体积感知多摄像头驾驶场景生成器(WoVoGen)是一个创新系统,旨在为自动驾驶创建逼真的街景视频。该系统使用机器学习和计算机视觉技术来生成高质量的街景视频,以帮助自动驾驶车辆更好地识别和适应不同的路况。W...
Read More谷歌工程师和科学家开发了一个新的代码库,名为CPP Gemma推理引擎。与llama.cpp类似,该代码库允许在SIMD CPU架构上进行推理。该工具的目的是鼓励实验和使用昨天发布的Gemma模型。
Read More近日,一款名为 PGlite 的神器在 GitHub 上发布,该神器可以让开发人员在浏览器、Node.js 和 Bun 中运行 Postgres,无需任何其他依赖。PGlite 的出现为 Postgres 的应用场景带来了更多可能性,开发人员可以更加方便...
Read More众所周知,现代对话模型依赖于纯文本输入,因此在语言和视觉交互中,模型的表现力有限。为了克服这些限制,研究人员一直在探索多模态对话系统。在此背景下,ChatterBox是一种优秀的多模态对话模型,可在新建立的多模...
Read MoreLorax是一款支持将多个LoRA模型热插拔到单个基础模型上的推理服务器。这意味着在支持广泛的模型调整范围的同时,RAM内存占用会大幅减少。
Read More近日,一项新的研究挑战了结合监督微调和强化学习的训练方法的有效性。研究表明,在初始训练中使用更先进的模型(如GPT-4)可以优于更复杂的两步方法。这一研究的开源代码已经发布到GitHub上,供科研人员使用和参考...
Read MoreGoogle已经发布了其Gemma 2B和7B参数模型的权重,可通过HuggingFace获得。这些模型是仅解码器的Transformer,训练了2T和6T个令牌。它们在各种基准测试中都比Llama 2表现出色,并提供基础和指令调整版本。
Read MorePages CMS是一款为静态网站打造的开源内容管理系统。它允许开发者通过用户友好的界面直接在GitHub上编辑网站内容。Pages CMS旨在与Cloudflare Pages一起部署,使用Cloudflare Workers进行无服务器代码编写。
Read More