漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-05 talkingdev

Emissary-简单的基准测试基础设施

Emissary发布了一个基准测试平台,可以使开发人员在他们自己的条件下快速可靠地评估提示并管理模型迁移和回归。通过自动LLM辅助评估或将评级外包给Emissary,生成和扩展测试集,定义自定义指标,并协作地手动团队评...

Read More
2024-03-05 talkingdev

亚马逊将投资10亿美元的初创企业用于人工智能和机器人的结合

亚马逊的10亿美元工业创新基金旨在增加对将人工智能和机器人集成的公司的投资,旨在提高其物流网络的效率。

Read More
2024-03-05 talkingdev

人形机器人MagicBot,可烤棉花糖、折叠衣服和跳舞

MagicLab发布了MagicBot,这是一款能够烤棉花糖和跳舞的人形机器人。该机器人具有出色的平衡性和灵巧性——它能够完成空翻动作。MagicBot具有亚毫米级定位精度和几公斤的承重能力。本文提供了该机器人的视频展示。

Read More
2024-03-05 talkingdev

DSNIE-单目表面法向量估计新方法

DSNIE是一种方法,可以显著提高单目表面法向量估计的准确度,可用于多种计算机图形应用程序。DSNIE方法基于深度学习,使用卷积神经网络对输入图像进行处理,并输出表面法向量。该方法在各种室内和室外场景中进行了测...

Read More
2024-03-05 talkingdev

论文:CricaVPR引入新方法优化视觉地点识别

CricaVPR提出了一种新方法,通过关注多个图像之间的关系,即使在不同的条件下也能提高视觉地点识别的准确性。传统的视觉地点识别方法通常只考虑单个图像,而CricaVPR的方法将多个图像整合起来,进一步提高了识别精度...

Read More
2024-03-05 talkingdev

使用 Unsolth 加速 Gemma 训练速度 2.4 倍

Unsloth 项目旨在重写训练和推理语言模型的重要内核。它发布了一个示例,其中包括 Google 开源的 Gemma 模型的代码。通过使用 Unsolth,Gemma 的训练速度可以提高 2.4 倍。这个项目的目标是通过修改模型的内核,实现...

Read More
2024-03-05 talkingdev

Smooth Diffusion-增强文本到图像扩散模型的潜在空间平滑度

一种名为Smooth Diffusion的新方法解决了文本到图像扩散模型的潜在空间平滑度挑战。该方法确保在输入微小调整时,图像呈现出一致和逐渐的变化。

Read More
2024-03-05 talkingdev

dust3r-轻松实现 3D 几何视觉

这个项目支持从一组松散相关的图像中构建 GLB 格式的 3D 表示,这意味着您可以拍摄一个地点的几张照片,为 3D 使用重构它。

Read More
  1. Prev Page
  2. 688
  3. 689
  4. 690
  5. Next Page