漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-05 talkingdev

DSNIE-单目表面法向量估计新方法

DSNIE是一种方法,可以显著提高单目表面法向量估计的准确度,可用于多种计算机图形应用程序。DSNIE方法基于深度学习,使用卷积神经网络对输入图像进行处理,并输出表面法向量。该方法在各种室内和室外场景中进行了测...

Read More
2024-03-05 talkingdev

论文:CricaVPR引入新方法优化视觉地点识别

CricaVPR提出了一种新方法,通过关注多个图像之间的关系,即使在不同的条件下也能提高视觉地点识别的准确性。传统的视觉地点识别方法通常只考虑单个图像,而CricaVPR的方法将多个图像整合起来,进一步提高了识别精度...

Read More
2024-03-05 talkingdev

使用 Unsolth 加速 Gemma 训练速度 2.4 倍

Unsloth 项目旨在重写训练和推理语言模型的重要内核。它发布了一个示例,其中包括 Google 开源的 Gemma 模型的代码。通过使用 Unsolth,Gemma 的训练速度可以提高 2.4 倍。这个项目的目标是通过修改模型的内核,实现...

Read More
2024-03-05 talkingdev

Smooth Diffusion-增强文本到图像扩散模型的潜在空间平滑度

一种名为Smooth Diffusion的新方法解决了文本到图像扩散模型的潜在空间平滑度挑战。该方法确保在输入微小调整时,图像呈现出一致和逐渐的变化。

Read More
2024-03-05 talkingdev

dust3r-轻松实现 3D 几何视觉

这个项目支持从一组松散相关的图像中构建 GLB 格式的 3D 表示,这意味着您可以拍摄一个地点的几张照片,为 3D 使用重构它。

Read More
2024-03-05 talkingdev

论文:为什么学习率可以转移?

一篇理论论文试图解释MuP超参数转移的成功。其作者发现训练损失Hessian矩阵的最大特征值与网络的宽度和深度无关。

Read More
2024-03-05 talkingdev

GPT-4只能成功完成14%的Agent任务

社区对代理在处理各种数字工作负载方面的潜力非常兴奋。然而,即使是最好的通用模型也难以完成人类70%以上成功的任务。显然,我们可能需要专门针对这些任务进行训练的模型。

Read More
2024-03-05 talkingdev

论文:Gemini在1m+代币窗口中使用HyperAttention技术

众所周知,Gemini的惊人1m+代币窗口使用HyperAttention技术取得了如此的成功。这种技术可使计算机通过模拟人类大脑中的注意力机制来聚焦于代币,并识别出其中的关键信息。HyperAttention技术不仅提高了Gemini的精度...

Read More
  1. Prev Page
  2. 709
  3. 710
  4. 711
  5. Next Page