漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-09 talkingdev

SenseVoice开源:具有多重语音情感理解能力的基础模型

近日,GitHub发布了一款名为SenseVoice的语音基础模型。这款模型拥有多重语音理解能力,包括自动语音识别、口语语言识别、语音情感识别以及音频事件检测。自动语音识别技术可以实现对人类语音的智能理解;口语语言识...

Read More
2024-07-09 talkingdev

论文:从休闲视频中无人监督估计类别级3D姿态

科研人员已经开发出一种新的方法,可以从休闲的,以对象为中心的视频中,无需人类监督就可以估计出类别级的3D姿态。这种新方法的开发,无疑为3D姿态估计领域带来了新的突破。在无人监督的情况下,能够从视频中准确估...

Read More
2024-07-08 talkingdev

超级智能——十年后的今天

十年前,Nick Bostrom的影响力之作《超级智能》问世。如今,人工智能的进步使得人工普适智能(AGI)及其风险成为主流讨论的重点。在2024年这个转折点,AI研究社区现在正在紧急解决AI安全问题,以确保其控制力和与人...

Read More
2024-07-06 talkingdev

Fabric:开源框架可利用人工智能增强人类能力

Fabric是一款由加拿大滑铁卢大学团队开发的开源框架,旨在利用人工智能技术来增强人类的认知和行为能力。该框架结合了人工智能、机器学习、智能传感器等技术,可用于开发各种可穿戴设备和智能环境。使用Fabric,人们...

Read More
2024-07-04 talkingdev

如何在企业AI领域取胜 —— 一份实战手册

这份专注于AI的实战手册概述了企业采用AI的策略,突出了从人类执行的服务向被称为“服务即软件”的软件驱动的工作流的转变。它深入探讨了对商业模式的影响,如绩效基础定价,并强调了工作流捕获和AI准确性对于成功实施...

Read More
2024-07-03 talkingdev

mm-instruct:利用多样化的视觉指导数据提升多模态模型的性能

MM-Instruct是一个大规模数据集,旨在提升大型多模态模型(LMMs)的指令跟随能力。这个数据集集合了大量的指令和相关的视觉内容,帮助模型更好地理解和执行人类的指令。通过这种方式,MM-Instruct能够为多模态模型提...

Read More
2024-07-02 talkingdev

论文:以10亿人格特征来创建合成数据的新方法

近期,一项新的研究将网络文本视为来自某种“人格”,并以此作为条件,显著提高了下游任务的性能。研究人员发现,在数学领域,这种方法使性能提升了20个百分点。这项研究的方法是通过大规模网络文本数据,创造出约10亿...

Read More
2024-07-02 talkingdev

ReaLHF开源-提高训练效率

ReaLHF是一个创新的系统,通过在训练过程中动态重新分配参数并优化并行化,提升了人类反馈的强化学习(RLHF)的效率。这一技术的主要特点在于,它可以根据训练的实际需求,灵活调整系统参数和并行化优化策略,从而实...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page