漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-25 talkingdev

OpenAI向好莱坞推介视频生成工具Sora

OpenAI正将其视频生成工具Sora推介给多家好莱坞制片厂、艺人经纪公司以及媒体高管。Sora是一款基于人工智能技术的视频制作软件,能够根据文本提示生成逼真的视频画面。这一工具的推广可能会对电影制作、广告创意以及...

Read More
2024-03-22 talkingdev

苹果与谷歌洽谈,或将集成Gemini AI技术于iPhone

苹果公司正在与谷歌进行谈判,以期将Gemini生成性AI技术集成到iPhone中。此外,苹果也在考虑使用OpenAI的ChatGPT。这一举措标志着苹果在人工智能领域的雄心壮志,可能为iPhone用户带来前所未有的智能体验。若谈判顺...

Read More
2024-02-29 talkingdev

MobiLlama: 移动设备上的全开源小型语言模型

MobiLlama是一个完全开源、透明、小型的语言模型,适用于移动设备。它的表现对于一个0.5B参数模型来说非常出色,甚至超过了一些更大的模型。

Read More
2024-02-20 talkingdev

GPTScript:新的自然语言模型编程体验

GPTScript是一种新的脚本语言,可以自动化与OpenAI大型语言模型的交互。该项目的最终目标是创建一个完全基于自然语言的编程体验。GPTScript使用了最新的自然语言处理技术,使得编程变得更加直观和容易上手。GPTScrip...

Read More
2024-02-15 talkingdev

SGLang:针对LLMs设计的结构化生成语言开源

近日,针对LLMs设计的结构化生成语言SGLang在GitHub上发布。SGLang的设计目的是为了帮助LLMs更加轻松地构建结构化的文本生成模型,从而加速生成文本的过程。SGLang采用了类似于HTML的标记语言来描述文本结构,同时支...

Read More
2024-02-08 talkingdev

Laxta语言模型为巴斯克文提供支持

Laxta是一个新的自然语言处理公司,为巴斯克语提供了一套新的语言模型。该模型使用了大约40亿个单词的语料库,并经过了特别调整,以更好地支持巴斯克语言。这种语言模型的使用可以提高文本生成、机器翻译、对话系统...

Read More
2024-02-06 talkingdev

IMG2Music-图像转音乐方案

通过将图像转换为文本,文本转化为提示,提示转化为音乐,可以创建一个引人入胜的图像到音乐的流水线。

Read More
2024-01-30 talkingdev

RAG:探索ColBERT和RAGatouille

ColBERT是一个出色的模型,用于为RAG应用嵌入查询和索引数据。本文探讨了该方法背后的直觉,并进行了一些基准测试。ColBERT的特点在于,它将查询和文档嵌入到一个共享空间中,从而可以直接在该空间中进行相似性匹配...

Read More
2024-01-24 talkingdev

MM-Interleaved模型开源,可实现图文数据生成

近日,GitHub开源了MM-Interleaved模型,该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像,同时也可以从图像中提取文本。该模型使用了条件生成对抗网络(Co...

Read More
2024-01-24 talkingdev

交互式控制文本生成技术革新,多模态语言模型中引入“提示高亮器”

研究人员引入了“提示高亮器”方法,它革新了多模态语言模型中的文本生成技术,使用户能够突出提示的某些部分,从而更好地控制生成的文本。这种方法提供了一种更加灵活、直观和有效的交互式控制方式,使得文本生成的结...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page