漫话开发者 - UWL.ME

2023-10-06 talkingdev

谷歌DeepMind携手33个研究所，打造“机器人行动ImageNet”

谷歌的DeepMind与33个研究所联手，共同开发了名为Open X-Embodiment的数据库，这个数据库相当于计算机视觉中的ImageNet数据库。这个数据库包含来自22种机器人类型的500多个技能和150,000个任务，旨在通过提供共享资...

2023-10-06 talkingdev

计算机科学家们正在用GPT-4来解决长期存在的P=NP问题。来自微软和北京大学的一组研究人员引导GPT-4用一系列的提示来探索这个问题，采用苏格拉底式的方法，导致了一些启示，暗示P不等于NP。这种方法代表了提示工程的...

2023-10-06 talkingdev

本文将深入探讨人工智能研究暂停的辩论。这个辩论主要考虑，如果人工智能研究突然暂停6个月会发生什么？或者在恰到好处的时机暂停然后再重新开始会有何影响？又或者，暂停足够长的时间以制定良好的监管机制，甚至直...

2023-10-06 talkingdev

机械可解释性是通过将神经网络分解为更可解释的子部分来理解神经网络的过程。不幸的是，神经元本身往往不可解释。有一些深层次的原因，如叠加，导致了这个挑战。Anthropic公司的这项工作使用稀疏自编码器从一层Trans...

2023-10-06 talkingdev

在3D场景中检测和命名新物体一直是一个艰巨的挑战。然而，最近一个名为CoDA的项目提出了一种新的解决方法。该方法通过智能猜测新物体可能出现的位置，然后将这些物体的特征与图片和文本进行匹配，所有这些操作都在一...

2023-10-06 talkingdev

Ctoc是一个开源项目，其主要功能是提供一种轻量级的代码库分析工具，可以在令牌级别分析代码库。这种工具允许开发者更深入地理解他们的代码，特别是在处理大型代码库时，它可以帮助开发者更有效地定位和解决问题。Ct...

2023-10-06 talkingdev

Meta科学家最近开发出了一种全新的方法，通过研究大脑波形，理解人们思考或听到的词语和短语，而无需进行任何手术。这一技术或许将为我们提供新的视角，去理解大脑如何处理和解码语言信息。通过这种方法，我们将有可...

2023-10-06 talkingdev

在多GPU和多节点系统上训练语言模型存在多种挑战，且在这些场景下积累经验也非常困难。本篇博客文章详尽深入地研究了ZeRO，FSDP，以及在大规模训练或微调模型时可能遇到的问题。我们需要理解，进行分布式训练并不仅...