模型的相关内容 - 漫话开发者

2023-10-20 talkingdev

XAgent：开源自主代理工具

XAgent是一个开源的实验性LLM驱动的自主代理工具，可以自动解决各种任务。该工具利用深度学习算法，训练出一个自主学习的模型，可以在不同的环境中自动适应并完成任务。XAgent提供了丰富的API接口，可以与其他工具无...

2023-10-20 talkingdev

HuggingFace 上现已推出 Fuyu-8B，这是一款专为数字代理设计的多模态模型。与其他多模态模型不同的是，它具有简化的架构，并支持任意图像分辨率，在不到 100 毫秒的时间内响应大图像。尽管针对特定应用程序，Fuyu-8B...

2023-10-20 talkingdev

DALLE-3研究论文揭示了其惊人性能的主要成分，包括合成标题生成器、改进的潜在扩散建模以及提升的忠实度、风格和连贯性测量方法。DALLE-3是一种生成式模型，具有非常出色的生成图像的能力，其原理是通过大量的图像和...

2023-10-19 talkingdev

ChatGPT的Browse With Bing现已退出Beta测试，DALL-E 3正在进行Beta测试。这是OpenAI最近的两个重要更新，Browse With Bing是一款由OpenAI推出的基于自然语言的浏览器，用户可以通过聊天的方式寻找信息，而DALL-E 3...

2023-10-19 talkingdev

斯坦福人工智能与人类中心研究所（Stanford HAI）最新发布的“基础模型透明度指数”显示，主要的AI基础模型开发者在社会影响方面提供的信息不足。虽然Meta的Llama 2在透明度方面得分最高，为54%，其次是BloomZ和OpenAI...

2023-10-19 talkingdev

这项研究介绍了Zipformer，一种用于自动语音识别（ASR）的改进Transformer模型，它更快、占用更少内存，而且比广泛使用的Conformer效果更好。Zipformer是一种新型的语音识别模型，它使用了一种全新的架构，能够更快...

2023-10-19 talkingdev

研究人员开发出BitNet，这是一种新的大型语言模型设计，使用更少的能量和内存。BitNet使用一种新的技术来平衡模型的准确性和计算效率，同时减少了对大量数据的依赖。这一新设计的目的是为了降低大型语言模型的计算成...

2023-10-19 talkingdev

大规模训练中的不稳定性对于大多数研究人员来说很难复制。一项新论文展示了如何在小模型中重现这些不稳定性，并验证了许多常见的修复方法在这些小模型上同样有效。该论文的作者认为，这样做有助于提高大规模训练的可...