模型的相关内容 - 漫话开发者

2024-02-29 talkingdev

ShieldLM：支持自定义检测与决策解释的LLM安全检测器

最近，研究人员开发了一种名为ShieldLM的安全检测器，可帮助大型语言模型遵守人类安全标准，并提供自定义检测和解释决策的功能。该工具可检测模型是否存在安全问题，例如对不同种族、性别或群体的人有偏见，或者可能...

2024-02-29 talkingdev

FuseChat推出了一种创新的方式，将多个大型语言模型的优势融合成一个更强大的模型，而不需要进行高成本的从头训练。

2024-02-29 talkingdev

据悉，字节跳动开发了一种名为 MegaScale 的系统，可用于训练大规模并行的大型语言模型。该系统成功地在 12,288 个 GPU 上训练了一个 175B 的语言模型，达到了 55.2% 的模型 FLOPs 利用率，相当惊人。此外，字节跳动...

2024-02-29 talkingdev

音乐理解通常需要在语言模型中添加特定编码器，这往往既昂贵又不稳定。然而，一项新的研究发现，将音乐转换为ABC符号后，音乐理解能力显著提高，且不会影响基本的语言能力。

2024-02-29 talkingdev

函数调用是指语言模型可以通过合成的函数访问工具来完成其给定的指令。这需要正确合成参数以传递给这些函数。这个排行榜旨在评估模型在函数调用任务上的能力。

2024-02-28 talkingdev

HuggingFace Hub 近期合并发布了 AlphaMonarch 7B 模型，这个经过调优的模型在 elo 和 static benchmarks 中表现优异。它专门为多轮对话和指令跟踪等任务而设计，将会成为自然语言处理领域的一大利器。

2024-02-28 talkingdev

Axolotl是一款用于Fine-tuning语言模型的强大库。最近，开发者推出了Lazy Axolotl，一款Colab Notebook，它可以帮助用户轻松地进行Fine-tuning操作。Lazy Axolotl提供了丰富的预训练模型和Fine-tuning脚本，用户只需...

2024-02-28 talkingdev

旧金山计算公司（SF Compute）现在推出了全球最便宜的H100训练集群，并提供灵活的短期租赁选项，针对需要进行AI模型训练的客户，而无需长期承诺。其第一个集群Angel Island已经上线，另一个Bay Bridge即将推出。SF C...