漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-18 talkingdev

GPT-4指令调整实现突破性进展

以下为新闻内容的主要要点: - 研究人员利用GPT-4生成的指令跟踪数据进行LLaMA微调,实现了在英语和中文两种语言中新任务的零-shot表现优于之前的最先进模型。 - 该突破性进展伴随着全面的评估和奖励模型训练,数据...

Read More
2023-04-18 talkingdev

Soundini:自然视频编辑的声音引导扩散技术

## 新闻内容: - 提出一种新方法,使用零样本声音引导视觉效果进行视频编辑,利用时间声音特征创建动态样式,同时保持时间一致性。 - 通过使用光流引导,引导去噪扩散概率模型与音频潜在表示相结合,该方法优于现有...

Read More
2023-04-18 talkingdev

技术发布:多语言文本转图像模型

以下是该模型的三个核心要点: - 该模型能够处理多种语言的文本转图像,输出的质量非常高。 - 该模型基于LAION HighRes和内部专有图像数据集进行训练,尽管无法处理漫反射,但作者提供了在线演示。 - 该模型的参数...

Read More
2023-04-17 talkingdev

聊天机器人助力“超级兼职族”更高效地完成多份全职工作

新闻内容: - 疫情期间,随着居家办公的普及,“超级兼职族”开始在同一时间从事多份工作。 - 通过聊天机器人等技术的引入,这些“超级兼职族”能够更高效地完成工作。 - “超级兼职族”正在迅速发现,如何利用人工智能工...

Read More
2023-04-17 talkingdev

自主AI代理人的热度不断上升,GPT-4输出循环

新闻内容: - Agentic实现是尝试循环和迭代AI模型以尽可能少的人类干预来执行多步任务的尝试。 - 链接AI模型可能使它们比使用单个AI模型更有能力。Auto-GPT和BabyAGI等项目旨在在获得一般方向后执行任务。 - 这些项...

Read More
2023-04-17 talkingdev

AdaM技术:自适应人像抠图技术应用于动态视频

以下是本篇新闻的核心内容: - AdaM是一种适用于动态视频的自适应抠图技术,能够同时预测前景和背景,并捕捉各种不规则视频中的alpha通道细节。 - AdaM利用编码器-解码器网络和转换网络,提高了抠图的真实感和时间...

Read More
2023-04-17 talkingdev

VidStyleODE:神经-常微分方程技术实现视频编辑

新闻摘要: - VidStyleODE结合了StyleGAN和神经-常微分方程技术,实现了视频的分离表征,可以用于外观操作、运动操作、图像动画以及视频插值/外推等应用。 - VidStyleODE使得视频编辑变得更加容易和高效。 - VidSty...

Read More
2023-04-17 talkingdev

技术新闻】C-LoRA方法在图像生成中取得重大突破

以下是本文的主要内容: - 文本到图像扩散模型在定制连续性概念时面临灾难性遗忘问题,导致过去概念的图像生成质量低下。 - 我们提出的C-LoRA方法通过持续自我正则化的低秩适应性克服了这个问题,在连续扩散方面优...

Read More
  1. Prev Page
  2. 648
  3. 649
  4. 650
  5. Next Page