AR的相关内容 - 漫话开发者

2024-06-14 talkingdev

Meta推出低比特率音频编解码器 MLow

根据最新消息，Meta刚刚推出了一款全新的低比特率音频编解码器 MLow。这款编解码器可将高质量音频压缩至更小的文件大小，具有更快的加载速度和更少的带宽需求。据Meta介绍，该编解码器使用了先进的人工智能技术，可...

2024-06-13 talkingdev

GJK算法是一种用于计算凸多边形之间距离的算法。尽管它的名字很长，但它本质上是一种非常简单的算法。GJK的全称是Gilbert-Johnson-Keerthi，是由三位计算机图形学家发明的。他们的算法以一种非常奇特的方式工作，利...

2024-06-13 talkingdev

近日，Meta公司公布了一篇关于其如何规模化训练大型语言模型的论文。该论文详细介绍了Meta公司的训练方法，该方法可以同时训练多达14亿个参数的语言模型。该规模远超以往的语言模型训练规模，并且可以在更短的时间内...

2024-06-12 talkingdev

近日，一种名为人类高斯模型（Human Gaussian Model，简称HGM）的新型框架引起了科技界的关注。它能够仅通过一张图片，就实现3D人类模型的构建。这种框架以扩散为引导，将2D信息转化为3D模型，实现了在人体建模领域...

2024-06-12 talkingdev

LE3D是一种从RAW图像中实时合成高动态范围（HDR）视图的方法。这种方法在夜晚场景中表现尤其出色。随着技术的发展，现实场景的高质量渲染已经成为可能，而LE3D的提出，更是为实时HDR视图的合成提供了一种全新的解决...

2024-06-12 talkingdev

Mistral.rs是一款基于Rust的推理框架，其最新版本已经上线。这款框架在最新的版本中实现了性能的重大提升，增加了GGUF支持，并带来了更多其他改进。Mistral.rs是专为机器学习和人工智能研究者设计的一款强大工具，其...

2024-06-12 talkingdev

CARES是一个全面的评估框架，用于评估医疗大视觉语言模型（Med-LVLMs）的可信度。该框架的目标是确保这些模型能够在医疗环境中提供可靠且准确的结果。就像其他的人工智能模型一样，医疗大视觉语言模型的可信度是其成...

2024-06-12 talkingdev

PHATGOOSE是一种显著提高AI在没有先前暴露的情况下概括和学习新任务能力的方法。这种方法通过智能地在不同专业的语言模型之间进行路由，以完成任务的各个部分。零样本学习是一种让机器学习模型在没有见过任何训练样...