漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-12 talkingdev

LLM原理的可视化呈现

LLM可视化是一个网站,用于展示nano-gpt模型如何将6个字母的序列按字母顺序排序。nano-gpt模型是由85,000个参数组成的模型,其基础是GPT-2,该模型可用于生成自然语言文本。该网站使用了交互式的可视化工具,用户可...

Read More
2023-12-12 talkingdev

Stability AI发布StableLM Zephyr 3B聊天模型

稳定性人工智能公司发布了StableLM Zephyr 3B稳定聊天模型,该模型是StableLM 3B-4e1t模型的一个扩展,灵感来源于Zephyr 7B模型,旨在实现高效的文本生成,特别是在指令跟踪和问答上下文中。该模型已经使用直接偏好...

Read More
2023-12-11 talkingdev

MistralMLX文本生成示例

最近,Mistral发布了一个使用MLX生成文本的示例,这是一种基于人工智能的技术,它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到,它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...

Read More
2023-12-11 talkingdev

Kandinsky3.0:升级版文本转图像技术,实现更高质量、真实感的图像生成

Kandinsky 3.0是一种文本转图像模型,它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络(GAN)模型,通过学习图像语义和语法,从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

Read More
2023-11-10 talkingdev

双阶方法实现更高清的文本视频生成

I2VGen-XL模型采用双阶段方法解决视频合成中的挑战,例如保持语义准确性和清晰、连续的图像,首先将语义连贯性与视频质量增强分开处理。第一阶段专注于保留静态图像的内容,第二阶段则细化细节和分辨率。

Read More
2023-11-07 talkingdev

Deepspeed开源推理工具软件发布

Deepspeed推出了一款新软件,旨在与vLLM和文本生成界面竞争,以快速提供语言模型服务。该软件配备了许多最先进的加速功能,初步结果表明,速度提升了2.4倍。

Read More
2023-11-03 talkingdev

亚马逊推出RoPE微调Mistral 7B模型,支持长文本上下文

亚马逊开始进入开源LLM领域,推出RoPE微调Mistral 7B模型,支持长文本上下文。该模型可在上下文中扩展至32k个令牌,可用于各种自然语言处理任务,例如问答和文本生成。RoPE是亚马逊开发的一种新的训练技术,可提高大...

Read More
2023-10-31 talkingdev

Magnetic:轻松将LLM集成到您的Python中

Magnetic是一个用于轻松集成大型语言模型到Python代码的库。 这个名为Magnetic的库是由NLP引擎提供商Hugging Face发布的。基于Transformers,Magnetic允许您轻松地将大型语言模型集成到您的Python代码中,以进行各种...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page