漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-19 talkingdev

论文:用小模型研究大模型,研究人员通过小模型验证大模型训练中的不稳定性

大规模训练中的不稳定性对于大多数研究人员来说很难复制。一项新论文展示了如何在小模型中重现这些不稳定性,并验证了许多常见的修复方法在这些小模型上同样有效。该论文的作者认为,这样做有助于提高大规模训练的可...

Read More
2023-10-19 talkingdev

MonoSKD开源,一张图像实现3D物体检测

MonoSKD是一种革命性的方法,它使用一张图像就可以检测3D物体,有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征,而MonoSKD仅需要一张图像就能完...

Read More
2023-10-19 talkingdev

ChatGPT系统提示指南

系统提示可以改变基于ChatGPT的语言模型的行为。这个代码仓库包含一些非常好的系统提示,可以根据您的偏好改善可用性。

Read More
2023-10-19 talkingdev

Adept发布多模式LLM

Adept发布了一个极其简单(没有图像编码器)而且非常高效(超过了13B模型)的多模式模型。这篇文章概述了Adept如何评估模型的性能以及一些模型的细节。

Read More
2023-10-18 talkingdev

Lingo:可视化语言动作模型助力自动驾驶

Wayve推出了名为Lingo的模型,该模型可以处理可视化数据、解释其选择并采取行动。跨模态的组合表示是一种流行趋势,CLIP为其打响了头炮,它是机器人领域中一个具有成长空间的研究领域。

Read More
2023-10-18 talkingdev

LLMs在场景图生成中的改进技术应用开源

本研究介绍了LLM4SGG弱监督场景图生成方法,该方法利用大型语言模型的能力,从图像标题中更好地提取和对齐关系,解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

Read More
2023-10-18 talkingdev

开源Character-LLM,通过LLM模拟贝多芬

近日,一项名为 Character-LLM 的项目在 GitHub 上推出。该项目通过训练大型语言模型,以贝多芬和凯撒大帝等历史名人为蓝本,通过为它们提供特定的人物资料,从而模拟这些历史人物的语言风格和思想特征。这一技术的...

Read More
2023-10-18 talkingdev

百度发布ERNIE 4.0,声称与OpenAI的GPT-4不相上下

百度发布了其先进的人工智能聊天机器人ERNIE 4.0,并声称它与OpenAI的GPT-4不相上下。ERNIE 4.0是一种基于深度学习的语言模型,它在理解自然语言方面取得了重大突破。ERNIE 4.0能够更好地理解人类语言,并在语义理解...

Read More
  1. Prev Page
  2. 350
  3. 351
  4. 352
  5. Next Page