漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-30 talkingdev

使用LLM的成本是多少?

对不同模型的LLM常见问题的详细回顾表明,目前它真的是成本限制的。随着最新的OpenAI公告和开源模型的进展,这种情况可能会发生变化。虽然LLM在预测和生成自然语言方面表现出色,但目前的成本可能会限制其广泛应用。...

Read More
2023-11-30 talkingdev

数据驱动下的人工智能崛起

这是一篇以数据为基础的文章,从数据的角度审视了人工智能的崛起。我们经常听到这个话题,但支撑这个话题的数据是相当庞大的。最有趣的是开发者兴趣的增长和随之而来的崩溃。

Read More
2023-11-30 talkingdev

从视频中创建真实的3D人物头像技术开源

本项目提出了“可动态高斯化”技术,这是一种将2D CNN和3D高斯点转换技术结合起来的新技术,可以从视频中创建更逼真、更详细的人物头像。这种技术不仅可以用于游戏、虚拟现实等领域,还可以在电影、电视和广告等领域中...

Read More
2023-11-30 talkingdev

Roboflow开源适用于多模态模型的提示库

标记提示集是一种聪明的方法,可以显着提高视觉+语言模型的性能。Roboflow的这个库为您提供类似的控制,并使使用这些模型构建强大的视觉管道变得更加容易。它甚至支持像LLaVa这样的开放模型。

Read More
2023-11-30 talkingdev

Tanuki:轻松构建LLM技术驱动的应用,让应用变得更便宜、更快速

LLM是一种全新的机器学习技术,可以让应用程序在运行时不断学习和优化,从而实现更高效的性能和更低的成本。Tanuki是一款基于LLM技术的应用程序构建工具,可以帮助开发人员轻松创建这种具有自我学习和优化能力的应用...

Read More
2023-11-30 talkingdev

论文:使用生成扩散技术提升数据集精华提取

科学家们开发出一种新方法,使用生成扩散技术创建代理数据集,这种数据集具有更好的代表性和更多样化,同时需要的计算资源更少。这种方法可以通过在代理数据集中训练神经网络来提高模型的性能。这种方法可以降低计算...

Read More
2023-11-30 talkingdev

论文:创新方法增强手语视频隐私保护

DiffSLVA是一种创新的手语视频匿名化方法,可以在保留语言内容的同时进行隐私保护。该技术使用预训练的扩散模型和专门的面部表情模块,克服了以前的限制,不需要精确的姿势估计。

Read More
2023-11-30 talkingdev

论文:通过扩散模型实现先进的视频超分辨率技术

StableVSR是一种新颖的视频超分辨率(VSR)方法,利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比,StableVSR可以更好地处理不同的噪声和失真情况,并且在不需要额外训练数据的情况下也...

Read More
  1. Prev Page
  2. 828
  3. 829
  4. 830
  5. Next Page