模型的相关内容 - 漫话开发者

2024-02-26 talkingdev

Phind 70B Code Model表现卓越，人类评估得分83%

Phind的70B代码模型在人类评估中获得83%的高分，与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布，更大的70B模型也将在未来发布。

2024-02-26 talkingdev

GradSafe是一种新的方法，用于检测大型语言模型中的不安全提示，无需进行大量的训练。它通过分析特定参数的梯度，比当前方法更有效地识别不安全的提示。

2024-02-26 talkingdev

Stability AI宣布推出Stable Diffusion 3，这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型，参数范围从8亿到80亿，这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...

2024-02-23 talkingdev

众所周知，现代对话模型依赖于纯文本输入，因此在语言和视觉交互中，模型的表现力有限。为了克服这些限制，研究人员一直在探索多模态对话系统。在此背景下，ChatterBox是一种优秀的多模态对话模型，可在新建立的多模...

2024-02-23 talkingdev

最近，一种名为多视角扩散++的扩散模型引起了人们的注意。该模型可以生成一个对象的多个视图，然后将它们拼接在一起，形成一个引人入胜的3D版本。这个模型的基本原理是将对象分解成许多微小的部分，然后在每个部分上...

2024-02-23 talkingdev

GTBench是一个用于测试类似GPT-4这样的LLMs在各种游戏场景中发现其在策略推理方面的优势和劣势的平台。虽然这些模型在基于概率的游戏中表现出很大的潜力，但在确定性游戏中表现不佳，并且在设计和训练上表现也有所不...

2024-02-23 talkingdev

Lorax是一款支持将多个LoRA模型热插拔到单个基础模型上的推理服务器。这意味着在支持广泛的模型调整范围的同时，RAM内存占用会大幅减少。

2024-02-23 talkingdev

Predibase发布了25个狭窄的任务特定LoRA，每个在特定任务上都能超越GPT-4。这些任务特定的LoRA是建立在Mistral 7B模型之上的。这再次证明了本地模型在精确任务上表现异常出色的能力。