模型的相关内容 - 漫话开发者

2023-12-18 talkingdev

如何看待OpenAI Q*的超级智能传言

近日，关于OpenAI Q*的传言引发了广泛的讨论。OpenAI Q*被认为是可能会引领人工智能迈向通用推理能力的重要一步。然而，OpenAI Q*并不太可能成为导致人工智能普适智能的关键突破口。OpenAI Q*是一种基于强化学习的模...

2023-12-18 talkingdev

Nous Research （Hugging Face Hub）发布了一种名为Capybara的新的语言基础模型和Obsidian的多模态扩展模型，该模型拥有30亿参数，可以在手机等边缘设备上运行。

2023-12-18 talkingdev

一种新的研究方法通过在大型语言模型中引入物体标识符来改善对3D场景的理解并回答相关问题。该方法专注于识别和关联场景中的物体，在解释复杂的空间关系方面取得了有希望的结果，使得人工智能更加擅长这方面的任务。

2023-12-18 talkingdev

SwitchHead是使AI模型更高效的突破。它减少了Transformer的内存和计算需求，同时不会降低性能。SwitchHead是一种新颖的神经网络结构，可以在不丢失性能的情况下，将一个大型Transformer模型拆分为多个小型Transforme...

2023-12-18 talkingdev

OpenAI超级对齐团队最新成果表明，您可以使用更弱的监督模型来引导或对齐更强大的模型，类似于弱人类对齐超级智能模型。他们使用GPT-2恢复了GPT-4的大部分对齐性能。他们指出，这种方法具有可行的路径，可以实现显著...

2023-12-18 talkingdev

DeepMind最近在自然杂志上发表了一篇名为FunSearch的论文，该论文使用LLM引导的函数搜索，寻找数学和计算机科学中的开放问题的解决方案。它解决了capset问题，并发现了迄今为止最大的capsets。FunSearch的算法可以在...

2023-12-18 talkingdev

Answer AI是一家新的实验室，旨在找出现有模型的真正有效和有价值的用途，而不是建立新模型。它旨在为组织进行基础研究，以帮助他们解锁启用AI的用例。

2023-12-18 talkingdev

本文包含几个新的人工智能发展故事。这些故事涵盖了人工智能领域的竞争、行业就业现状、人工智能战略、Sourcegraph的Cody AI编码助手正式上线等。多年来致力于为其代码添加注释的工程师们为大型语言模型推理其代码提...