漫话开发者 - UWL.ME

2024-03-05 talkingdev

Emissary-简单的基准测试基础设施

Emissary发布了一个基准测试平台，可以使开发人员在他们自己的条件下快速可靠地评估提示并管理模型迁移和回归。通过自动LLM辅助评估或将评级外包给Emissary，生成和扩展测试集，定义自定义指标，并协作地手动团队评...

2024-03-05 talkingdev

亚马逊的10亿美元工业创新基金旨在增加对将人工智能和机器人集成的公司的投资，旨在提高其物流网络的效率。

2024-03-05 talkingdev

MagicLab发布了MagicBot，这是一款能够烤棉花糖和跳舞的人形机器人。该机器人具有出色的平衡性和灵巧性——它能够完成空翻动作。MagicBot具有亚毫米级定位精度和几公斤的承重能力。本文提供了该机器人的视频展示。

2024-03-05 talkingdev

DSNIE是一种方法，可以显著提高单目表面法向量估计的准确度，可用于多种计算机图形应用程序。DSNIE方法基于深度学习，使用卷积神经网络对输入图像进行处理，并输出表面法向量。该方法在各种室内和室外场景中进行了测...

2024-03-05 talkingdev

CricaVPR提出了一种新方法，通过关注多个图像之间的关系，即使在不同的条件下也能提高视觉地点识别的准确性。传统的视觉地点识别方法通常只考虑单个图像，而CricaVPR的方法将多个图像整合起来，进一步提高了识别精度...

2024-03-05 talkingdev

Unsloth 项目旨在重写训练和推理语言模型的重要内核。它发布了一个示例，其中包括 Google 开源的 Gemma 模型的代码。通过使用 Unsolth，Gemma 的训练速度可以提高 2.4 倍。这个项目的目标是通过修改模型的内核，实现...

2024-03-05 talkingdev

一种名为Smooth Diffusion的新方法解决了文本到图像扩散模型的潜在空间平滑度挑战。该方法确保在输入微小调整时，图像呈现出一致和逐渐的变化。

2024-03-05 talkingdev

这个项目支持从一组松散相关的图像中构建 GLB 格式的 3D 表示，这意味着您可以拍摄一个地点的几张照片，为 3D 使用重构它。