漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-06 talkingdev

Pygmalion推理引擎开源

Aphrodite引擎可以用于减少VRAM需求,提高AI推理工作负载的吞吐量。Pygmalion推理引擎是一种全新的AI推理引擎,它可以在减少VRAM需求的同时提高吞吐量。该引擎基于Aphrodite引擎并进行了优化,可以在保持准确性的同...

Read More
2024-01-30 talkingdev

基于Phi-2和SigLIP训练的多模态模型,可在本地设备上运行

最近,一款基于Phi-2和SigLIP训练的多模态模型Imp v1 3B发布了。该模型在性能上表现极为出色,并且体积小,足以在设备上运行。Imp v1 3B的发布,对于未来的多模态研究和应用具有重要意义。目前,该模型的开源代码已...

Read More
2023-12-21 talkingdev

TokenAny-可对任何事物进行标记

近日,GitHub仓库上线了一款全新的模型,可同时进行图像分割、识别和标注,超越了之前的能力。这个新模型的优势在于可以标记任何事物,不再局限于传统的图像和文本。目前,该模型已经在多个领域得到了广泛的应用,包...

Read More
2023-12-21 talkingdev

STSSNet,增强型实时渲染项目

该项目介绍了时空超采样(STSS),这是一个显著改进实时渲染高分辨率、高帧率内容的框架。该项目已在GitHub上发布,用户可以从中获取源代码并进行使用。

Read More
2023-12-20 talkingdev

Google Vision开源权重分片,提升多节点系统训练效率

Google的Big Vision项目是一个研究和生产最先进的视觉系统的重要工具库。最近,他们添加了权重分片,使得在多节点系统上的训练更加容易。这个新功能可以将模型分成多个子模型,分别在不同的节点上进行训练,最后再将...

Read More
2023-12-18 talkingdev

如果AI正在使图灵测试过时,什么可能更好?

研究人员提出了一个新颖的框架,将人工智能程序视为心理研究中的参与者。该框架有三个步骤:在一系列实验中测试程序的推理能力,测试其对自身推理方式的理解,并且如有可能,检查程序源代码的认知适应性。虽然目前的...

Read More
2023-12-13 talkingdev

KwaiAgents发布AI代理系统,使用LLM模仿人类认知技能

KwaiAgents是一个先进的代理系统,使用大型语言模型来模仿人类认知技能。该系统可以应用于自然语言处理、语音识别等领域。KwaiAgents的开放源代码已经上传至GitHub平台,使得更多的研究人员可以参与到该项目中来。该...

Read More
2023-12-05 talkingdev

SAFE:一种用于模式识别的融合框架开源

SAFE是一种新的模式识别融合框架,它结合了预训练的视觉和语言模型,使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景,具有广泛的应用前景。在实现过程中...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page