漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-06 talkingdev

Anthropic公司的下一步:朝向可解释性的发展

机械可解释性是通过将神经网络分解为更可解释的子部分来理解神经网络的过程。不幸的是,神经元本身往往不可解释。有一些深层次的原因,如叠加,导致了这个挑战。Anthropic公司的这项工作使用稀疏自编码器从一层Trans...

Read More
2023-10-06 talkingdev

Google即将推出的Gemini模型或将超越GPT-4

据悉,Google即将推出名为Gemini的新型人工智能模型,有望超越现有的GPT-4模型。随着AI技术不断获得视觉和语音能力,其应用范围也在不断扩大,同时也引发了人们对其潜在问题的关注。人工智能的未来取决于人类如何负...

Read More
2023-10-05 talkingdev

Claude推出新技术提升技术文档索引能力

Claude最近推出了一项新技术,该技术将其记忆库的容量提高到了100,000个令牌。此次技术升级主要通过两种技术实现了对技术文档的索引能力的提升。Anthropic公司也对此进行了全面的发布,并推出了名为'Anthropic Cookb...

Read More
2023-10-05 talkingdev

深度解析:在Jax中运行SDXL与TPU v5的协同作用

SDXL是一种最先进的图像生成模型,虽然强大,但运行速度较慢。然而,Google与HuggingFace最近在Google的研究语言Jax中展示了它在新型TPU芯片上的运行速度。通过这种新的硬件加速,SDXL的性能得到了极大的提升,可以...

Read More
2023-10-04 talkingdev

数据是否仍然是护城河?AI生成技术重新塑造数据价值观

AI生成技术正在重塑我们对大量数据收集的传统价值观。大型语言模型可以通过最小化的数据进行微调,甚至可以生成合成数据集,这使得专有数据的独特性和重要性可能正在逐渐减弱。在过去,我们通常认为数据量的大小和独...

Read More
2023-10-04 talkingdev

巨型世界模型助力自动驾驶技术的发展

大多数自动驾驶系统都是基于规则的、专家系统和学习模块的大规模组合。Wayve公司的最新研究展示了一个具有90亿参数的联合视频、动作和文本模型,该模型在多样化的场景中表现出色。这个模型通过学习和理解大量的驾驶...

Read More
2023-10-04 talkingdev

高效大规模3D场景重建:对自驾车至关重要的新方法

重新构建大型3D场景,特别是在一些数据缺失的情况下,对于自驾车来说至关重要。这种名为PC-NeRF的新方法,通过结合两个模块来优化多层次的重建,即使在数据不完整的情况下,也能确保3D模型的详细程度。PC-NeRF的两个...

Read More
2023-10-04 talkingdev

论文:使多模态大型语言模型适应各种任务

多模态大型语言模型在许多任务中表现优秀,但在定位图像中的特定对象方面往往存在困难。为了改善这一问题,研究人员已经开发出一种新的方法:将物体的位置转化为文本,并通过特殊任务进行模型的训练。这种方法的出现...

Read More
  1. Prev Page
  2. 128
  3. 129
  4. 130
  5. Next Page