漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-05 talkingdev

前Snap AI主管推出Diffuse,挑战OpenAI的Sora视频生成器

由前Snap高管Alex Mashrabov创立的Higgsfield AI公司,最近推出了Diffuse,这是一款面向创作者和社交媒体市场营销人员的移动优先AI视频创作和编辑应用程序。Diffuse的推出,直接挑战了OpenAI的Sora视频生成器。与Sor...

Read More
2024-03-19 talkingdev

Cranelift代码生成器来到Rust

Rust编程语言近年来越来越流行,而现在Cranelift代码生成器也加入了这个生态系统。Cranelift是一个基于LLVM的代码生成器,它的目的是为多种语言提供通用的代码生成器。Rust作为一种系统级编程语言,需要高效的代码生...

Read More
2024-03-05 talkingdev

谷歌联合创始人谢尔盖·布林在罕见的公开露面中表示公司“绝对搞砸了”Gemini图像发布

Alphabet联合创始人谢尔盖·布林退休后回归工作,专注于人工智能,上周末在加利福尼亚州希尔斯伯勒的“AGI之家”与一群人工智能爱好者交流,谈到了人工智能对搜索的影响以及谷歌如何在人工智能不断发展的情况下保持领先...

Read More
2024-02-26 talkingdev

WoVoGen-高质量街景视频生成器开源

世界体积感知多摄像头驾驶场景生成器(WoVoGen)是一个创新系统,旨在为自动驾驶创建逼真的街景视频。该系统使用机器学习和计算机视觉技术来生成高质量的街景视频,以帮助自动驾驶车辆更好地识别和适应不同的路况。W...

Read More
2024-02-16 talkingdev

文本驱动的图像编辑无需蒙版

研究人员开发了一种基于文本提示进行图像编辑的独特方法。这种方法使用文本到图像模型和边界框生成器来识别需要编辑的区域,从而无需蒙版或草图即可进行更改。该方法可实现文本驱动的图像编辑,可以大大提高图像编辑...

Read More
2024-02-15 talkingdev

SGLang:针对LLMs设计的结构化生成语言开源

近日,针对LLMs设计的结构化生成语言SGLang在GitHub上发布。SGLang的设计目的是为了帮助LLMs更加轻松地构建结构化的文本生成模型,从而加速生成文本的过程。SGLang采用了类似于HTML的标记语言来描述文本结构,同时支...

Read More
2024-02-07 talkingdev

ChatDB发布NaturalSQL模型,Text-to-SQL指令性能达到最新水平

ChatDB发布了一系列名为NaturalSQL的模型,这些模型在Text-to-SQL指令上表现出最新的性能。NaturalSQL是一个基于自然语言处理的SQL查询生成器,能够将自然语言指令转化为SQL查询语句。这个开源项目已经在GitHub上开...

Read More
2024-01-25 talkingdev

Lumiere-谷歌AI视频生成器能够将可爱的动物放入不同场景中

Lumiere是一款使用时空扩散模型进行逼真视频生成的AI视频生成器。它使用的Space-Time U-Net架构可以一次性生成整个视频的时间持续时间。它旨在处理视频中物体的位置以及物体如何移动和变化。Lumiere可以执行文本到视...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page