漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-23 talkingdev

用LangChain在Go中集成LLM

LangChain是一款可以方便地将语言模型集成到您的Go程序中的工具。这包括使用Ollama等框架运行本地模型。

Read More
2023-11-23 talkingdev

精准前瞻解码可减少推理延迟2.3倍

加速自回归语言模型推理的方式有很多。人们正在热衷于使用草稿模型的一种方式。这需要两个模型,但速度可能会更慢。然而,通过从相同模型生成相关的n-gram,可以减轻对草稿模型的需求,并使生成速度线性加快。

Read More
2023-11-23 talkingdev

谷歌推迟Gemini的发布

谷歌推迟了其大型语言模型(LLM)和GPT-4竞争对手Gemini的发布时间,直到2024年第一季度,原因是担心其无法达到或超越OpenAI的GPT-4,并且着重于在允许外部开发人员访问之前加强其消费者产品。

Read More
2023-11-23 talkingdev

微软和英伟达简化了在Windows上运行AI模型的过程

微软宣布了Windows AI Studio,这是一个供开发人员访问和配置AI模型的中心,提供了来自Azure AI Studio和Hugging Face的工具以及模型配置界面和性能测试模板等功能。英伟达更新了其TensorRT-LLM,支持GeForce RTX 30...

Read More
2023-11-22 talkingdev

微软发布小型语言模型Orca 2,训练模型进行推理学习

Orca模型是微软的一组小型模型,擅长推理任务。由于许多信息被保密,因此存在关于其有效性的担忧。现在发布了Orca 2,该模型可在HuggingFace上获得。它展现了良好的性能,超过了几个较大模型的推理基准。

Read More
2023-11-22 talkingdev

论文:流行公共模型可能没有在测试集上训练

一种深入研究训练语言模型所使用的数据的方法。研究结果表明,许多闭源模型可能没有在流行的基准测试上进行训练。

Read More
2023-11-21 talkingdev

StyleTTS 2发布:结合风格扩散和对抗训练,实现接近人类自然语音合成

StyleTTS 2是一款文本转语音模型,旨在通过将风格扩散和对抗训练与大型语音语言模型相结合来实现接近人类水平的语音合成。StyleTTS 2是在原有StyleTTS模型的基础上进一步优化,采用了更加先进的多任务学习技术,使得...

Read More
2023-11-20 talkingdev

生产级LLM工具开发者指南

使用语言模型构建工具是一种新兴的工程学科,涵盖了高性能计算、GPU编排和监控。在这个领域,LLMs(语言模型)是至关重要的组件,它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用L...

Read More
  1. Prev Page
  2. 93
  3. 94
  4. 95
  5. Next Page