漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-05 talkingdev

论文:为什么学习率可以转移?

一篇理论论文试图解释MuP超参数转移的成功。其作者发现训练损失Hessian矩阵的最大特征值与网络的宽度和深度无关。

Read More
2024-03-04 talkingdev

Summarize-用AI在一分钟内获取YouTube视频摘要

Summarize.ing是一款使用人工智能技术的产品,可以在一分钟内为YouTube视频生成摘要。这款产品可以帮助用户快速了解视频内容,不必花费大量时间观看整个视频。Summarize.ing使用基于深度学习的算法来分析视频内容,...

Read More
2024-03-04 talkingdev

如何将自己的模型添加到Ollama仓库

Ollama是一个开源的模型库,提供了各种各样的机器学习模型。这个库可以帮助数据科学家和机器学习工程师快速开发和部署模型。但是,有时候我们需要使用自己的模型。在本文中,我们将介绍如何将自己的模型添加到Ollama...

Read More
2024-03-04 talkingdev

Genie世界模型:可生成交互式环境

Google DeepMind的Genie是一个基础的世界模型,通过在互联网视频上进行训练,可以从合成图像、照片甚至草图中生成各种可玩(动作可控)的环境。该模型使用了深度强化学习和生成式建模技术,可以为游戏开发、虚拟现实...

Read More
2024-03-04 talkingdev

Modular推出MAX开发者版,加速AI部署

Modular推出了一款名为MAX的工具包,可大大简化和加速AI部署。现在可用。MAX提供了一个简单易用的接口,可以在几分钟内为任何深度学习模型构建和部署一个API。它还为开发人员提供了一个可扩展的插件系统,以便更轻松...

Read More
2024-03-04 talkingdev

科学家如何使用声波来黑客大脑

韩国的研究人员已经发现了一种使用超声波刺激影响神经元之间连接形成的方法。超声波可以以惊人的精度深入大脑。这种技术模仿了学习和记忆过程中普遍存在的脑电波。这可能会引发新的医疗治疗方式,使每个人的学习变得...

Read More
2024-03-01 talkingdev

CharacterAI推出适用于机器学习编码的形状后缀

Character AI公司的一种编码风格极大地提高了张量中形状的可读性。这种风格使用形状后缀来标识张量中的形状,例如“weights_2x3”表示形状为2x3的权重张量。这种命名约定使得代码更加易读和易于理解,特别是对于机器学...

Read More
2024-03-01 talkingdev

HiGPT:学习异构图谱的新方法

HiGPT 是一种学习跨异构图谱的方法,不需要微调。它与新颖的图谱分词器和大量的图谱指令相结合,使其在适应各种数据分布方面表现出色。

Read More
  1. Prev Page
  2. 91
  3. 92
  4. 93
  5. Next Page