语言模型的相关内容 - 漫话开发者

2023-11-23 talkingdev

亚马逊据称正在使用两倍于GPT-4的参数进行AI训练

亚马逊正在为进入AI竞赛做准备，推出Olympus，这是一个拥有2万亿参数的大型语言模型，旨在超越OpenAI的GPT-4和谷歌的Bard。这一举措有望将亚马逊推向人工智能技术的前沿。虽然目前尚不清楚Olympus的推出时间表，但它...

2023-11-23 talkingdev

LangChain是一款可以方便地将语言模型集成到您的Go程序中的工具。这包括使用Ollama等框架运行本地模型。

2023-11-23 talkingdev

加速自回归语言模型推理的方式有很多。人们正在热衷于使用草稿模型的一种方式。这需要两个模型，但速度可能会更慢。然而，通过从相同模型生成相关的n-gram，可以减轻对草稿模型的需求，并使生成速度线性加快。

2023-11-23 talkingdev

谷歌推迟了其大型语言模型（LLM）和GPT-4竞争对手Gemini的发布时间，直到2024年第一季度，原因是担心其无法达到或超越OpenAI的GPT-4，并且着重于在允许外部开发人员访问之前加强其消费者产品。

2023-11-23 talkingdev

微软宣布了Windows AI Studio，这是一个供开发人员访问和配置AI模型的中心，提供了来自Azure AI Studio和Hugging Face的工具以及模型配置界面和性能测试模板等功能。英伟达更新了其TensorRT-LLM，支持GeForce RTX 30...

2023-11-22 talkingdev

Orca模型是微软的一组小型模型，擅长推理任务。由于许多信息被保密，因此存在关于其有效性的担忧。现在发布了Orca 2，该模型可在HuggingFace上获得。它展现了良好的性能，超过了几个较大模型的推理基准。

2023-11-22 talkingdev

一种深入研究训练语言模型所使用的数据的方法。研究结果表明，许多闭源模型可能没有在流行的基准测试上进行训练。

2023-11-21 talkingdev

StyleTTS 2是一款文本转语音模型，旨在通过将风格扩散和对抗训练与大型语音语言模型相结合来实现接近人类水平的语音合成。StyleTTS 2是在原有StyleTTS模型的基础上进一步优化，采用了更加先进的多任务学习技术，使得...