Visual Autoregressive Models是一个新的GitHub项目,它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开,但目前该项目已经引起了技...
Read More近日,开发者社区GitHub上出现了一项名为SqueezeAttention的新技术,该技术针对大型语言模型(LLMs)的键值缓存进行了优化。通过SqueezeAttention,内存使用量能够显著降低30%至70%,同时吞吐量也得到了翻倍提升。这...
Read More近日,GitHub上发布了一项新的基准测试工具——化学工作台(Chemistry Bench),旨在评估大型语言模型在处理化学问题方面的能力。该工具与Big-Bench兼容,能够对语言模型的科学素养进行有效衡量。化学工作台通过一系列...
Read More谷歌近日推出了一款面向企业用户的人工智能代码补全和辅助工具——Gemini Code Assist。该工具曾以已停止的Duet AI品牌提供服务,并在2023年底全面开放使用。Code Assist不仅是一次品牌重塑,也是一次重大更新。它采用...
Read MoreLocalSearch 是一个基于LLM Agents的完全本地运行的搜索引擎。该技术允许用户在不依赖外部服务器的情况下,实现高效的本地数据检索。这一创新性项目已经在GitHub上开源,开发者可以自由地下载和使用。LocalSearch 的...
Read More近期在GitHub上发布的ReFT(Representation Fine-Tuning)项目,为微调语言模型带来了一种新的参数高效方法。与传统的PeFT相比,ReFT在保持强大性能的同时,大大降低了成本。该方法通过精细化调整模型参数,使得在进...
Read MoreMeta的研究团队近日推出了一款新型的优化器,并已在X平台上公开代码及其多种集成方式。这款优化器的独特之处在于它不依赖于学习率(LR)调度,训练过程中无需预先设定总步数。经过实证,该优化器在包括语言模型在内...
Read More本文讲述了Stack Overflow的创建历程及其在未来十年是否能在工程文化中占有一席之地。在Stack Overflow之前,是Experts Exchange,作为互联网上最早的问答网站之一,它自1996年起便存在。Experts Exchange免费运营了...
Read More近日,一款名为pgmock的新技术引起了开发者社区的广泛关注。pgmock是一个内存中的虚拟PostgreSQL服务器,专为单元和端到端测试设计。该技术的特点在于它完全在WebAssembly中运行,不需要任何外部依赖即可在Node.js和...
Read MoreWinBtrfs是一款开源的btrfs驱动程序,为Windows操作系统提供了对btrfs文件系统的支持。Btrfs是一种现代的文件系统,具有许多优点,例如快照、RAID、数据压缩和容错能力。WinBtrfs使得Windows用户可以更好地使用btrfs...
Read More