漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-20 talkingdev

Orb 简化 AI 产品的计费问题

大多数公司仍在思考如何为 AI 和 LLM 工具计费。是套餐?积分?代币?无论您选择哪种模型,Orb 都能使其实现起来非常容易。只需选择您的定价模型和计费指标即可!跟踪消费、防止欺诈,并将定价与价值(包括 GPU 运行...

Read More
2023-11-20 talkingdev

使用纯Pytorch加速分割任务

我们可以通过使用Torch编译、稀疏化、与Triton一起使用自定义内核以及其他PyTorch性能特性,将分割任务的速度提高8倍。

Read More
2023-11-20 talkingdev

SentAlign-大型文档句子对齐工具

SentAlign是一种新的用于对齐大型平行文档中句子的工具,可以高效地处理数千到数万个句子。该工具可帮助研究人员和工业界从大型文本中提取信息,并提高机器翻译等自然语言处理任务的效果。SentAlign使用了一种基于变...

Read More
2023-11-20 talkingdev

一份帮助了解学生行为的数据集

研究人员扩展了SCB-ST-Dataset4,该数据集记录了诸如举手、阅读和书写等活动,以更好地通过深度学习来了解和检测学生的课堂行为。这个数据集是通过在课堂上安装传感器来捕捉学生行为的。研究人员使用了不同的深度学...

Read More
2023-11-20 talkingdev

论文:改进视频问答的新方法

研究人员发现,大型语言模型在视频问答(VideoQA)中有时会出现错误,这是因为它们过于依赖语言而忽略了实际的视频内容。为了解决这个问题,研究人员引入了一种名为Flipped-VQA的新方法,这种方法使得这些模型更好地...

Read More
2023-11-20 talkingdev

微软推出深度伪造技术生成器

微软在2023年的Microsoft Ignite活动上推出了Azure AI语音文本转换成语音化身,使用户可以使用文本转语音技术创建能够以多种语言说出预设文本的逼真化身。深度伪造技术是一种利用人工智能技术生成逼真但是虚假的视频...

Read More
2023-11-20 talkingdev

Meta公布视频编辑和创作模型

往往情况下,当你使用生成模型生成一张图片后,它不完全是你想要的。然而,使用同一模型对图像进行编辑是极具挑战性的。Meta有一个关键的想法,即将所有生成视为指令,从而使编辑功能出现。这与新的模型架构的简单性...

Read More
2023-11-20 talkingdev

DeepMind与YouTube合作推出音乐合成系统

DeepMind在音乐合成领域已经有多年的研究,现在刚刚宣布推出了一个功能强大的新系统。有趣的是,这个系统的很大一部分提升来自于与音乐版权方的数据合作。这意味着,模型在训练时使用了艺术家的音乐,以得到更好的效...

Read More
  1. Prev Page
  2. 852
  3. 853
  4. 854
  5. Next Page