在最新的研究进展中,科学家提出了一种广义离散扩散方法,该方法显著改进了在文本等离散数据上的扩散过程。这一创新通过引入一种广义的去噪过程和略微改进的掩码方案,使得训练过程更加高效,并赋予了模型自我校正输...
Read More近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,利用基于角色的提示(persona-based prompting)来确保生成内容的一致性和准确性。MovieAgent进一步使用Stable Diffusion视频模型...
Read MoreHugging Face与Yaak合作推出了L2D数据集,这是目前最大的开源多模态数据集,专为汽车人工智能(AI)领域设计。该数据集包含了从驾驶学校收集的专家和学生驾驶策略,并通过自然语言指令增强了空间智能模型的能力。这...
Read MoreReka公司近日开源了其最新推出的Reka Flash 3模型,这是一款拥有210亿参数的多功能模型,专门针对推理、聊天、编码和指令遵循等任务进行了优化。该模型在性能上与专有模型不相上下,并配备了32k的上下文长度,使其非...
Read MoreNebius AI Studio近日推出了精细调优功能,旨在让用户能够根据特定需求定制领先的AI模型。这一功能支持超过30种SOTA模型,并允许用户从无服务器架构通过AI Studio无缝扩展到预留云环境,所有操作均在Nebius生态系统...
Read More近日,GitHub上发布了一项名为Perception Efficient Reconstruction的创新技术,该方法将文本查询能力与从图像中进行3D重建的技术相结合。该系统采用前馈模型(feed forward model),能够实现快速的三维重建。这一...
Read More近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,并采用基于角色的提示机制,显著提升了视频生成的一致性和准确性。MovieAgent利用Stable Diffusion视频模型生成并拼接帧,从而实现...
Read More随着全球劳动力市场的快速变化,机器人技术正成为推动新劳动力经济的核心力量。然而,美国在这一领域的布局似乎滞后于其他国家。机器人技术不仅能够提高生产效率,还能在医疗、物流、制造等多个领域创造新的就业机会...
Read More