漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-06 talkingdev

Perplexity AI推出在线LLM,或将取代谷歌搜索

Perplexity AI将网络索引和最新信息与会话式AI聊天机器人界面相结合,有可能取代谷歌。该公司最近发布了从Mistral和Meta开源模型中微调和增强的版本。这些模型旨在提供有用、真实和最新的信息。它们是第一个基于网络...

Read More
2023-12-06 talkingdev

Nous Research发布Hermes 2.5视觉模型

Nous Research发布了Hermes 2.5视觉模型,该模型基于最佳的7B语言模型和SigLIP集成,是一种强大的新型开源文本和视觉模型,可在消费级硬件上运行。这里的一个很酷的创新是集成函数调用。由于存在幻觉问题,该模型仍...

Read More
2023-12-05 talkingdev

SAFE:一种用于模式识别的融合框架开源

SAFE是一种新的模式识别融合框架,它结合了预训练的视觉和语言模型,使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景,具有广泛的应用前景。在实现过程中...

Read More
2023-12-05 talkingdev

MaXTron,新的视频全景分割技术开源

MaXTron是一种简单而有效的统一元架构,用于视频分割。

Read More
2023-12-05 talkingdev

MoMask-文字转动画技术开源,实现细粒度控制

MoMask文字转动画技术是一项新颖的技术,其作者在此领域的基础性工作已有了新的进展。他们采用了新颖的编码方法,使得最终的动画生成具有细粒度控制能力,可以更具创意地生成动画效果。此技术的优点是可以通过更改编...

Read More
2023-11-30 talkingdev

使用LLM的成本是多少?

对不同模型的LLM常见问题的详细回顾表明,目前它真的是成本限制的。随着最新的OpenAI公告和开源模型的进展,这种情况可能会发生变化。虽然LLM在预测和生成自然语言方面表现出色,但目前的成本可能会限制其广泛应用。...

Read More
2023-11-30 talkingdev

从视频中创建真实的3D人物头像技术开源

本项目提出了“可动态高斯化”技术,这是一种将2D CNN和3D高斯点转换技术结合起来的新技术,可以从视频中创建更逼真、更详细的人物头像。这种技术不仅可以用于游戏、虚拟现实等领域,还可以在电影、电视和广告等领域中...

Read More
2023-11-30 talkingdev

Roboflow开源适用于多模态模型的提示库

标记提示集是一种聪明的方法,可以显着提高视觉+语言模型的性能。Roboflow的这个库为您提供类似的控制,并使使用这些模型构建强大的视觉管道变得更加容易。它甚至支持像LLaVa这样的开放模型。

Read More
  1. Prev Page
  2. 198
  3. 199
  4. 200
  5. Next Page