MMedLM 2是一种开创性的多语言语言模型,专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中,MMedLM 2的表现优于其他模型,包括GPT-4。
Read More谷歌工程师和科学家开发了一个新的代码库,名为CPP Gemma推理引擎。与llama.cpp类似,该代码库允许在SIMD CPU架构上进行推理。该工具的目的是鼓励实验和使用昨天发布的Gemma模型。
Read MorePhind的70B代码模型在人类评估中获得83%的高分,与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布,更大的70B模型也将在未来发布。
Read MoreGradSafe是一种新的方法,用于检测大型语言模型中的不安全提示,无需进行大量的训练。它通过分析特定参数的梯度,比当前方法更有效地识别不安全的提示。
Read More近日,研究人员提出了一种新的文本识别方法——类别感知的掩膜引导特征细化(CAM feature refinement),该方法可以有效提高文本在复杂场景下的识别能力。该方法通过对文本图像进行类别感知的特征细化,达到更好的文本...
Read MoreStability AI宣布推出Stable Diffusion 3,这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型,参数范围从8亿到80亿,这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...
Read More近日,一款名为 PGlite 的神器在 GitHub 上发布,该神器可以让开发人员在浏览器、Node.js 和 Bun 中运行 Postgres,无需任何其他依赖。PGlite 的出现为 Postgres 的应用场景带来了更多可能性,开发人员可以更加方便...
Read More