AR的相关内容 - 漫话开发者

2024-03-04 talkingdev

论文：深度语义理解，从粗到细的潜在扩散图像合成方法

粗到细潜在扩散（CFLD）方法引入了一种新的姿势引导人像合成方法，通过对图像进行深度语义理解来避免过拟合，克服了现有模型的局限性。

2024-03-04 talkingdev

UniVS是一种用于视频分割的统一架构，采用新颖的基于提示的方法应对各种分割任务的挑战。通过将提示特征作为查询并引入目标感知的提示交叉注意力层，UniVS消除了启发式的帧间匹配需求，可以无缝适应不同的视频分割场...

2024-03-04 talkingdev

随着人工智能模型的不断发展，越来越多的研究人员开始研究如何在不影响模型准确性的前提下，提高模型的计算效率和内存利用率。LLM量化是一种后训练量化技术，可以使像OPT和LLaMA2这样的大型语言模型更具内存和计算效...

2024-03-04 talkingdev

Google DeepMind的Genie是一个基础的世界模型，通过在互联网视频上进行训练，可以从合成图像、照片甚至草图中生成各种可玩（动作可控）的环境。该模型使用了深度强化学习和生成式建模技术，可以为游戏开发、虚拟现实...

2024-03-04 talkingdev

Modular推出了一款名为MAX的工具包，可大大简化和加速AI部署。现在可用。MAX提供了一个简单易用的接口，可以在几分钟内为任何深度学习模型构建和部署一个API。它还为开发人员提供了一个可扩展的插件系统，以便更轻松...

2024-03-04 talkingdev

机器人公司Figure日前宣布完成由OpenAI等多家大型投资者领投的6.75亿美元融资。该公司将继续开发人形机器人。

2024-03-04 talkingdev

谷歌正在限制Rooted Android设备使用RCS，以确保设备遵循RCS标准定义的操作措施。

2024-03-04 talkingdev

JavaScript注册表（JSR）是一个针对TypeScript进行优化的包注册表，仅支持ES模块 - 它适用于Deno和基于npm的项目。相较于npm，JSR有较好的安全性和可靠性。开发者可以使用JSR来安装和管理TypeScript包，同时也能使用...