漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-19 talkingdev

Writer获得1亿美元融资,为其面向企业的生成型AI平台注入动力

Writer正在研发一款“全栈”生成型AI平台,专为企业服务。近日,该公司成功获得ICONIQ Growth领导的1亿美元B轮融资,该资金将用于推进其“行业特定”的文本生成AI模型的研发。在竞争激烈的市场中,Writer以非版权商业写...

Read More
2023-09-18 talkingdev

GPT-4性能并未系统性下滑

与普遍观点相反,GPT-4的性能并未系统性地下滑。人工智能领域的专家和研究者们普遍认为,随着训练时间的增加,模型的性能会出现下滑,然而,这并不是GPT-4的情况。GPT-4的性能持续稳定,并显示出强大的学习和预测能...

Read More
2023-09-18 talkingdev

一键动图技术开源,点击即可看到你的图像动起来!

生成动态技术结合了现代和经典的人工智能技术,能够在静态图像中合成运动。更为重要的是,这种技术具有完全的交互性。用户只需要简单的点击操作,就可以看到自己的图像动起来,为静态的图像注入了生命力。这种技术的...

Read More
2023-09-18 talkingdev

论文:一种音频模型能同时处理语音、音乐和声音

研究人员已经开发出一种名为EncodecMAE的方法,该方法借鉴了基于文本的模型的思想,用来创建一个通用音频模型。这种新的方法对于理解语音、识别音乐或者识别环境中的声音等不同类型的音频任务都有很好的效果。Encode...

Read More
2023-09-18 talkingdev

SPDTransNet开源,应用Transformers进行更深入的睡眠分析

变压器是一种智能算法,通常用于处理文本或图像。这个项目调整了它们,使其能够与EEG数据一起工作,以更好地理解睡眠阶段。变压器的这种新应用打开了一个新的可能性,即通过使用复杂的深度学习模型来解决健康问题,...

Read More
2023-09-15 talkingdev

MLPerf结果强调了生成AI和存储的日益重要性

MLPerf发布了两个基准测试套件的结果:MLPerf Inference v3.1和MLPerf Storage v0.5。前者显示了创纪录的参与度和性能提升,后者评估了机器学习训练工作负载的存储系统性能。推理基准测试套件引入了一个大型语言模型...

Read More
2023-09-14 talkingdev

UMMAFormer:有效识别视频中的伪造内容

随着人工智能制造的假内容的增多,我们急需一种能够精确识别被修改视频部分的方法,而新工具“UMMAFormer”就能更有效地识别这些视频中的假内容。相比以往的方法,“UMMAFormer”在识别视频伪造部分上表现出了更高的效率...

Read More
2023-09-14 talkingdev

instaflow-利用流校正技术实现文本到图像生成的超速进程

研究人员已经找到一种方法,通过使用名为校正流(Rectified Flow)的技术,加快将文本转化为图像的过程。校正流技术是一种新颖的方法,它可以加速和优化图像的生成过程。这种方法凭借其高效的性能,为文本到图像的快...

Read More
  1. Prev Page
  2. 39
  3. 40
  4. 41
  5. Next Page