漫话开发者 - UWL.ME

2024-02-26 talkingdev

MMedLM-医学领域新突破，多语种医学语言模型

MMedLM 2是一种开创性的多语言语言模型，专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中，MMedLM 2的表现优于其他模型，包括GPT-4。

2024-02-26 talkingdev

谷歌工程师和科学家开发了一个新的代码库，名为CPP Gemma推理引擎。与llama.cpp类似，该代码库允许在SIMD CPU架构上进行推理。该工具的目的是鼓励实验和使用昨天发布的Gemma模型。

2024-02-26 talkingdev

Phind的70B代码模型在人类评估中获得83%的高分，与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布，更大的70B模型也将在未来发布。

2024-02-26 talkingdev

GradSafe是一种新的方法，用于检测大型语言模型中的不安全提示，无需进行大量的训练。它通过分析特定参数的梯度，比当前方法更有效地识别不安全的提示。

2024-02-26 talkingdev

近日，研究人员提出了一种新的文本识别方法——类别感知的掩膜引导特征细化（CAM feature refinement），该方法可以有效提高文本在复杂场景下的识别能力。该方法通过对文本图像进行类别感知的特征细化，达到更好的文本...

2024-02-26 talkingdev

Sierra旨在通过AI代理彻底改变客户与品牌的互动，将对话式AI定位为所有客户体验方面的必要新技术类别。

2024-02-26 talkingdev

Stability AI宣布推出Stable Diffusion 3，这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型，参数范围从8亿到80亿，这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...

2024-02-26 talkingdev

近日，一款名为 PGlite 的神器在 GitHub 上发布，该神器可以让开发人员在浏览器、Node.js 和 Bun 中运行 Postgres，无需任何其他依赖。PGlite 的出现为 Postgres 的应用场景带来了更多可能性，开发人员可以更加方便...