模型的相关内容 - 漫话开发者

2024-03-07 talkingdev

稳定扩散 3：研究论文

稳定扩散 3 通过其新颖的多模态扩散转换器架构，通过文本和图像的分别处理权重，提高了提示理解和排版，优于领先的文本到图像模型，为AI生成的视觉内容带来了进步。

2024-03-07 talkingdev

OpenAI回应了Elon Musk的诉讼，并公开了Sam Altman、Ilya Sutskever、Greg Brockman和Elon Musk之间的邮件交流截图。这些截图显示，Musk认为OpenAI的成功率为0％，并同意有必要对某些模型进行闭源处理。

2024-03-07 talkingdev

本文讨论如何为大型语言模型构建结构化文档，以及在整个过程中需要考虑的最佳实践。首先，为LLM编写文档时应当注意文档的结构及可读性。其次，可以通过提供示例代码、使用清晰的术语和概念以及清晰的语言来使文档更...

2024-03-07 talkingdev

Meta的技术路线图一直延伸到2026年，其中之一是开发一种AI推荐模型，以推动公司的Reels短视频服务和更传统的长视频。目前，该公司为其每个产品使用单独的模型。新的推荐系统将为用户提供更有吸引力和相关的内容。Met...

2024-03-07 talkingdev

一家名为LLMify的初创公司正在推出一种新的方法来训练语言模型，他们将在没有预训练模型的情况下从零开始培训LLMs。该公司的创始人表示，这种方法可以提高模型的准确性和适用性，并加快训练时间。该公司已经引起了一...

2024-03-06 talkingdev

SURE技术是一种将多种技术结合起来，提高深度神经网络对于图像分类任务中不确定性预测可靠性的新方法。该方法通过模型置信度估计、模型不确定性估计和置信度校准三个步骤来实现置信度的提高。SURE技术的应用将大大提...

2024-03-06 talkingdev

近日，开源Sora计划在GitHub上成立，旨在打造类似OpenAI的文本到视频模型。该计划目前正在构建基础组件，并寻求有兴趣的开源贡献者的帮助。据悉，Sora模型通过将自然语言转化为场景描述，再将其转化为视频，实现了文...

2024-03-06 talkingdev

近日，研究人员开发了一种名为Resonance RoPE的新技术，帮助LLMs更好地理解和生成比其原始训练序列更长的文本。这种方法在现有的Rotary Position Embedding（RoPE）系统上进行了改进，提高了模型在长文本上的性能，...