近日,一项名为LLMLingua的新项目在GitHub上开源。该项目使用对齐后的小型语言模型检测提示中的无关标记,并实现对黑盒LLM的压缩推理,从而实现了高达20倍的压缩比,且性能损失最小。简言之,LLMLingua能够帮助开发...
Read More一家名为whiterabbitneo的新公司,这个名字是对电影矩阵的一个引用,已经发布了一个包含13B参数的语言模型,旨在为攻击和防御网络安全提供帮助。它经过训练,可以回答关于计算机安全的问题并提供相关信息。
Read MoreGoogle的Big Vision项目是一个研究和生产最先进的视觉系统的重要工具库。最近,他们添加了权重分片,使得在多节点系统上的训练更加容易。这个新功能可以将模型分成多个子模型,分别在不同的节点上进行训练,最后再将...
Read MoreDeepEval是一款全能的LLM应用评估框架,可让用户轻松识别和迭代不令人满意的LLM输出。它目前提供了14+种评估指标,如幻觉、摘要、G-Eval、RAGAS等,供用户以Pytest样式或组件化方式评估整个数据集。
Read More上周推出的 Coffee 可以通过插入现有的代码库来帮助前端开发中的 AI 流程。该项目专注于基于 Coframe 团队从利用 AI 生成 80% 以上前端的经验中获得的一流 DX。Coffee 将使用人工智能来改进前端开发工作流程,从而使...
Read MoreTransformer模型虽然强大,但是由于其不稳定性,训练起来常常会很困难。其中一个主要的问题是注意力矩阵的熵崩溃。本文介绍了一种通过简单的重新参数化来防止熵崩溃的方法。
Read More最新研究介绍了一种名为LLF-LUT的技术,该技术通过专注于重要的图像细节来提高HDR照片的质量。相比于传统方法,这种技术可以更准确地处理高对比度场景,并提供更具真实感的图像。该技术已经在GitHub上发布,供开发者...
Read More