往往情况下,当你使用生成模型生成一张图片后,它不完全是你想要的。然而,使用同一模型对图像进行编辑是极具挑战性的。Meta有一个关键的想法,即将所有生成视为指令,从而使编辑功能出现。这与新的模型架构的简单性...
Read More本项目引入一种名为“distance indexing”的新方法,以改进传统的视频帧插值技术(VFI),该技术通常难以准确预测物体的运动。这种方法通过向模型提供有关物体在帧之间移动的距离的明确信息,来明确学习目标并减少模糊...
Read More近日,有学者在GitHub上发布了一项新的研究项目,名为“知识偏好对齐(KnowPAT)”,该项目旨在利用大型语言模型来改进领域特定问答系统。研究人员借助该技术,可以更加精准地针对特定领域提出问题,从而得到更加准确...
Read More经过增强的LLaMA模型现已包含16,000个泰米尔语令牌,利用了LoRA方法进行高效训练。这个更新,连同Alpaca和OpenOrca数据集的新的泰米尔语版本,显著改进了泰米尔语文本处理,为印度语言人工智能的未来发展铺平了道路...
Read More研究人员发现,尽管大型语言模型是为文本设计的,但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频,研究人员在各种视觉任务中取得了改进的结果。该研究结果表明,基于文本的AI...
Read More自动驾驶汽车的地标匹配是一项重要的技术,其能力直接关系到自动驾驶汽车的定位和导航精度。近日,研究人员提出了一种名为RobustMat的新方法,通过使用空间信息和神经微分方程,改进了自动驾驶汽车在不同条件下匹配...
Read MoreOpenAI首席执行官Sam Altman在该公司的首次开发者大会上展示了公司AI模型的新功能和改进,强调了未来AI融合将在消费科技中发挥核心作用。本次活动突显了OpenAI向产品为中心的转变,新工具立即可用,并暗示了进军硬件...
Read MoreOpenAI最近发布了用于稳定扩散的一致性解码器,这将极大地改善潜在扩散模型生成图像的性能。这是一个开源项目,可在GitHub上获得。随着这种技术的进步,我们可以期待AI在图像生成方面的更多突破。
Read More在本周的OpenAI Dev Day上,OpenAI发布了一款名为GPT-4 Turbo的API,它可以提供128k上下文的自然语言处理,以及自定义GPT和视觉功能。这款API的成本只有GPT-3的一小部分。此外,OpenAI还发布了一款名为Codex的API,...
Read MoreOpenAI Dev Day 今日召开,据悉我们可以期待 OpenAI 的开发者工具有所改进,ChatGPT 推出新的价格计划,以及 Gizmo V8,ChatGPT iOS 应用的全新升级版。此次更新将进一步提升 OpenAI 的开发者体验,为开发者提供更丰...
Read More