漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-18 talkingdev

GPT-4指令调整实现突破性进展

以下为新闻内容的主要要点: - 研究人员利用GPT-4生成的指令跟踪数据进行LLaMA微调,实现了在英语和中文两种语言中新任务的零-shot表现优于之前的最先进模型。 - 该突破性进展伴随着全面的评估和奖励模型训练,数据...

Read More
2023-04-18 talkingdev

Multimodal C4:一个开放的、具有十亿级图像的文本语料库

以下是本新闻的三个核心要点: - Multimodal C4(mmc4)是一个公开可用的数据集,它将纯文本的c4语料库与交错的图像相结合,支持像Flamingo这样的上下文视觉和语言模型。该数据集使用带有CLIP特征的线性分配算法创...

Read More
2023-04-18 talkingdev

Soundini:自然视频编辑的声音引导扩散技术

## 新闻内容: - 提出一种新方法,使用零样本声音引导视觉效果进行视频编辑,利用时间声音特征创建动态样式,同时保持时间一致性。 - 通过使用光流引导,引导去噪扩散概率模型与音频潜在表示相结合,该方法优于现有...

Read More
2023-04-18 talkingdev

1.2万亿数据集发布,可复现Llama训练

近日,Meta发布了一份1.2万亿标记数据集,可用于复现Llama模型的训练过程。该数据集是基于Llama论文中的训练混合比例构建而成,旨在解决由于许可限制而无法商业化应用的问题。 以下是该新闻的三个核心要点: - Met...

Read More
2023-04-17 talkingdev

聊天机器人助力“超级兼职族”更高效地完成多份全职工作

新闻内容: - 疫情期间,随着居家办公的普及,“超级兼职族”开始在同一时间从事多份工作。 - 通过聊天机器人等技术的引入,这些“超级兼职族”能够更高效地完成工作。 - “超级兼职族”正在迅速发现,如何利用人工智能工...

Read More
2023-04-17 talkingdev

自主AI代理人的热度不断上升,GPT-4输出循环

新闻内容: - Agentic实现是尝试循环和迭代AI模型以尽可能少的人类干预来执行多步任务的尝试。 - 链接AI模型可能使它们比使用单个AI模型更有能力。Auto-GPT和BabyAGI等项目旨在在获得一般方向后执行任务。 - 这些项...

Read More
2023-04-17 talkingdev

人工智能的崛起:人类和环境成本的增加

这篇文章指出,虽然生成式人工智能是一项令人兴奋的发展,但必须考虑到其对人类和环境造成的成本,例如能源消耗的增加、碳排放的增加,以及侵蚀创意职业或利用人类生成的内容的风险。以下是三个核心观点: - 生成式...

Read More
2023-04-17 talkingdev

VidStyleODE:神经-常微分方程技术实现视频编辑

新闻摘要: - VidStyleODE结合了StyleGAN和神经-常微分方程技术,实现了视频的分离表征,可以用于外观操作、运动操作、图像动画以及视频插值/外推等应用。 - VidStyleODE使得视频编辑变得更加容易和高效。 - VidSty...

Read More
  1. Prev Page
  2. 39
  3. 40
  4. 41
  5. Next Page