漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-21 talkingdev

如何在AdamW中联动调整学习率和权重

AdamW通常用于解耦学习率和权重衰减。然而,Pytorch中的常见实现并没有明确地做到这一点。本文讨论了如何调整这些参数。 AdamW是一种优化算法,它在Adam的基础上加入了权重衰减。AdamW的优点之一是可以解决权重衰减...

Read More
2024-02-12 talkingdev

1X机器人演示

1X是一家机器人公司,通过视频输入控制模型取得了进展。该公司展示了其机器人执行许多任务,所有任务都由神经网络驱动,从视频输入发出10hz控制信号。1X机器人演示了通过视频输入和神经网络控制的机器人的潜力,这是...

Read More
2024-02-09 talkingdev

1X发布视频展示全自主机器人的新能力,所有行为都由视觉神经网络控制

2023年,1X将其系统部署到神经网络中以从视觉中端到端地学习电机行为。最近,它发布了一个视频,展示了其人形机器人纯粹从数据中学习的一些新能力。视频展示了机器人从货架上拿起物品并放入容器中,将物品从地板上移...

Read More
2024-02-08 talkingdev

MetaVoice-开源13亿文本到语音模型

Meta Voice 是一个小而强大的文本到语音模型,支持生成和语音克隆。该模型基于深度神经网络和自回归模型,可用于多种应用场景,如语音合成、语音助手等。此外,Meta Voice 还支持多种语言,包括英语、中文、日语等。...

Read More
2024-02-07 talkingdev

CapH-单张照片3分钟生成多样化人像

CapHuman是一个框架,可以通过仅一张参考照片生成人物的多种表情和头部姿态。它巧妙地保持了人物的身份特征,让照片生成的多种人像看起来像是来自同一人。CapHuman使用的是神经网络技术,可以从单张照片中提取出关键...

Read More
2024-02-01 talkingdev

MAG-亿级推荐系统图神经网络实现开源

该项目介绍了MAcro Recommendation Graph(MAG)和Macro Graph Neural Networks(MacGNN),这些方法通过将相似的行为模式分组为宏节点来解决图神经网络的计算复杂性,从而显着减少了节点数。MAG和MacGNN能够有效地...

Read More
2024-01-29 talkingdev

论文:3D医学图像分割技术SegMamba

SegMamba是一种专为3D医学图像分割设计的模型,它提供了一种比Transformer架构更高效的替代方案。SegMamba采用全卷积神经网络架构,可以对3D医学图像进行有效的分割,尤其是在肿瘤分割方面表现出色。与传统的医学影...

Read More
2024-01-29 talkingdev

更好的图像相似度度量

图像相似度系统根据两个图像的相似程度给出分数。这项工作通过依赖于合成数据和人类偏好,改进了以前的方法。以往的方法主要是基于像素级别的相似度计算,而本研究使用了更先进的方法,如卷积神经网络,将图像表示为...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page