模型的相关内容 - 漫话开发者

2024-02-15 talkingdev

SGLang：针对LLMs设计的结构化生成语言开源

近日，针对LLMs设计的结构化生成语言SGLang在GitHub上发布。SGLang的设计目的是为了帮助LLMs更加轻松地构建结构化的文本生成模型，从而加速生成文本的过程。SGLang采用了类似于HTML的标记语言来描述文本结构，同时支...

2024-02-15 talkingdev

据外媒报道，OpenAI的CEO Sam Altman正在与投资者磋商，计划筹集高达7万亿美元用于AI芯片制造。该项目旨在解决GPU短缺问题，因为这些芯片对于训练和运行大型语言模型至关重要。潜在的投资者包括主权财富基金和政府实...

2024-02-15 talkingdev

GenTranslate是一种新的方法，它利用大型语言模型来提高翻译质量。它专注于基础模型生成的最佳翻译。该方法在测试中已被证明优于当前领先的翻译模型。

2024-02-15 talkingdev

随着大型语言模型与外部工具的配对越来越多，数据泄露的新风险已经出现。本文介绍了一种系统性的方法来评估这些人工智能系统保护私人信息的能力。研究人员发现，当前的大型语言模型在保护隐私方面存在一些问题。它...

2024-02-15 talkingdev

研究人员开发了一种新技术，通过使用基础模型自主选择高质量的数学内容来提高语言模型在数学方面的能力。这种新技术利用基础模型来选择数学内容，然后将其注入到现有的语言模型中，以提高其在数学方面的表现。这项技...

2024-02-15 talkingdev

Stable Cascade模型是一种新的仅用于研究的文本到图像模型，其在美学、提示忠实度和文本质量方面优于SDXL。它是使用Würstchen架构进行训练的，并具有多步架构，使调整变得容易。该模型的稳定性能够有效地提高图像生...

2024-02-15 talkingdev

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities（BASE TTS），该模型拥有980万个参数，并具有新兴特性，可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

2024-02-14 talkingdev

Axolotl是许多团队用来微调语言模型的工具。这个PR通过Pytorch和MPS添加了对Mac M设备的支持。