漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-22 talkingdev

论文:扩散状态空间模型引领图像生成新纪元

扩散状态空间模型(DiS)是一种新型的扩散模型,它采用状态空间骨干代替了传统的U-Net处理图像数据。这种模型在保持计算效率的同时,能够处理长距离依赖问题,并且能够生成高质量的图像。与传统的U-Net相比,DiS模型...

Read More
2024-03-20 talkingdev

苹果公司发布全新“MM1”人工智能模型细节

苹果公司近期公布了其新型人工智能模型“MM1”的详细信息。这一模型在训练大型语言模型方面采用了一种创新方法,能够无缝整合文本和视觉信息。这种整合方式有望提升AI模型在理解和处理复杂信息方面的能力,特别是在处...

Read More
2023-11-24 talkingdev

Andrej Karpathy的入门级LLM科普介绍视频

本次大型语言模型介绍将讨论它们是什么,它们的发展方向,与现有操作系统的比较和类比以及该领域的一些安全相关挑战。大型语言模型是如今人工智能研究中一个非常重要的部分,近年来得到了广泛关注和应用。它们的出现...

Read More
2023-11-23 talkingdev

亚马逊据称正在使用两倍于GPT-4的参数进行AI训练

亚马逊正在为进入AI竞赛做准备,推出Olympus,这是一个拥有2万亿参数的大型语言模型,旨在超越OpenAI的GPT-4和谷歌的Bard。这一举措有望将亚马逊推向人工智能技术的前沿。虽然目前尚不清楚Olympus的推出时间表,但它...

Read More
2023-08-31 talkingdev

全面医疗图像分割:挑战与突破

医疗图像分割是一个将图像中每个像素识别为特定类别(如癌症与非癌症)的过程。在历史上,将一个模型转移到另一个任务一直是个巨大的挑战。然而,最新的研究展示了一个强大的模型,该模型仍基于不朽的UNet,可应用于...

Read More
2023-05-23 talkingdev

Meta的语音识别技术可识别1100多种语言

Meta科学家在一个名为Massively Multilingual Speech(MMS)的项目中取得了突破性进展,教会了机器如何理解和说出成千上万种语言。该技术使用自学习系统和超过1,100种语言的数据库,旨在使信息更易于获取,并帮助保...

Read More
2023-05-16 talkingdev

视频问答技术取得突破性进展

近几个月来,视觉问答技术得到了广泛的应用和快速发展。这主要得益于像Blip和clip这样的预训练模型的出现。然而,将这些模型应用于视频问答仍然存在巨大的计算需求挑战。为了解决这个问题,研究人员引入了一系列不同...

Read More
2023-04-18 talkingdev

GPT-4指令调整实现突破性进展

以下为新闻内容的主要要点: - 研究人员利用GPT-4生成的指令跟踪数据进行LLaMA微调,实现了在英语和中文两种语言中新任务的零-shot表现优于之前的最先进模型。 - 该突破性进展伴随着全面的评估和奖励模型训练,数据...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page