模型的相关内容 - 漫话开发者

2024-02-27 talkingdev

Sam Altman呼吁提供7万亿美元支持人工智能发展

Sam Altman提出的7万亿美元的要求旨在支持推进GPT等生成式AI模型的成本迅速上升，这表明未来迭代的资源需求呈指数增长。这一雄心壮志凸显了人工智能发展的关键时刻，需要平衡快速技术进步和快速推进对安全和社会准备...

2024-02-27 talkingdev

这是一份关于使用LLMs进行注释的精选论文列表，LLMs是一种基于机器学习的语言模型，能够自动预测文本中的下一个单词或字符。使用LLMs进行注释可以提高注释的准确性和效率，目前在自然语言处理和计算机视觉领域被广泛...

2024-02-27 talkingdev

Anthropic的研究科学家一直在研究一种使用电路的理解深度神经网络的方法。这些电路旨在识别模型中用于特定任务的子部分。研究团队公布了他们尝试和结果的月度更新。通过使用电路，Anthropic的研究人员已经能够更好地...

2024-02-27 talkingdev

OpenCodeInterpreter模型基于CodeLlama和DeepSeek Coder，通过训练合成多轮数据集和使用人类反馈，能够在编程HumanEval基准测试中获得85%以上的准确率。

2024-02-27 talkingdev

Snap研究开发了一种视频生成模型，其速度比之前的最先进模型快3倍（排除Sora）。该模型可以生成高质量的视频，并且在处理速度方面具有显著优势。Snap的这项技术将对视频制作、社交媒体、游戏等领域产生重大影响。

2024-02-27 talkingdev

GeneOH扩散技术是一种新的技术，它通过改正手部动作和与物体的关系中的错误来提高模型对物体的理解和交互。这种方法专注于使这些交互更加自然。

2024-02-27 talkingdev

研究人员开发了一种新方法，通过采用专家级稀疏化方法来使LLMs更加高效和易于使用，该方法可以在不损失性能的情况下减少模型大小。这对于Mixture-of-Experts LLMs尤其有用，这种模型通常太大而不易处理。

2024-02-27 talkingdev

AlphaFold被用于预测蛋白质折叠后的状态。通过添加可逆的流匹配，您可以在整个蛋白质领域显著提高建模能力。在蛋白质结构预测领域，AlphaFold目前是最先进的计算机程序之一，它使用深度学习技术来预测蛋白质的三维结...