漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-15 talkingdev

NVIDIA联合创始人Curtis Priem捐赠2.75亿美元,帮助RPI推进量子计算研究

NVIDIA联合创始人Curtis Priem将自己的股份捐赠给了Rensselaer Polytechnic Institute (RPI),价值2.75亿美元。这笔捐款将有助于RPI推进其技术发展,并使其能够拥有IBM Quantum System One计算机。Priem在IPO后捐赠...

Read More
2024-03-15 talkingdev

ViT-CoMer:新神经网络模型增强Vision Transformers的密集预测任务能力

近日,一项名为ViT-CoMer的神经网络模型问世,增强了Vision Transformers(ViT)在密集预测任务中的表现,而无需预训练。这项研究由卡内基梅隆大学的学者领导,他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

Read More
2024-03-15 talkingdev

Skyvern:基于LLMs和计算机视觉的浏览器自动化工具

近日,Skyvern项目在GitHub上发布,该项目利用LLMs和计算机视觉技术自动化浏览器流程。Skyvern提供了一个简单的API端点,可以完全自动化手动工作流程,替代脆弱或不可靠的自动化解决方案。其实现原理是利用LLMs提供...

Read More
2024-03-14 talkingdev

MoAI:整合视觉任务信息的增强型语言模型

MoAI是一种新型的大型语言和视觉模型,它通过整合专门的计算机视觉任务的辅助视觉信息来增强当前模型。该模型在 GitHub 上发布,旨在改善自然语言处理和计算机视觉任务之间的互动。MoAI使用了一种新的训练方法,可以...

Read More
2024-03-12 talkingdev

微软AICI-实时控制语言模型的输出

人工智能控制界面(AICI)使您能够构建控制器,以实时约束和指导大型语言模型的输出。通过AICI,用户可以使用自己的约束条件或限制来约束模型的输出,同时还可以通过实时反馈来调整约束条件,从而实现更好的模型输出...

Read More
2024-03-12 talkingdev

扎克伯格坚称Quest 3也是计算机,不仅仅是为游戏而生,最新的Vision Pro回应

Quest 3不仅仅是为游戏而生,扎克伯格坚称它也是一台计算机。Quest的顶级应用程序包括社交应用程序、浏览器和视频播放器,同时也有一个对健身应用程序非常热情的社区。

Read More
2024-03-05 talkingdev

DSNIE-单目表面法向量估计新方法

DSNIE是一种方法,可以显著提高单目表面法向量估计的准确度,可用于多种计算机图形应用程序。DSNIE方法基于深度学习,使用卷积神经网络对输入图像进行处理,并输出表面法向量。该方法在各种室内和室外场景中进行了测...

Read More
2024-03-05 talkingdev

GPT-4只能成功完成14%的Agent任务

社区对代理在处理各种数字工作负载方面的潜力非常兴奋。然而,即使是最好的通用模型也难以完成人类70%以上成功的任务。显然,我们可能需要专门针对这些任务进行训练的模型。

Read More
  1. Prev Page
  2. 35
  3. 36
  4. 37
  5. Next Page