漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-24 talkingdev

Llama.cpp,新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而,它目前受到底层GGML格式的限制。为了解决这个问题,我们提出了一个新的格式,并开始进行集成。新的GGML格式将更加灵活,可以支持更多的模型,这将有助于推动机器...

Read More
2023-08-24 talkingdev

聊天机器人如何将生成AI转化为“多功能工具”

人工智能模型,例如GPT-3.5和GPT-4,已经从专门工具转变为多功能通用处理器。现在他们正在执行诸如文本分析、机器人技术和半导体设计等任务。这些模型的发展不仅仅扩大了人工智能的应用领域,也使得人工智能技术的普...

Read More
2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

Read More
2023-08-24 talkingdev

自我训练调查:机器学习新方向解析

半监督和自我监督学习是机器学习模型生成训练信号的地方。这与标准的监督、无监督和强化学习有所不同。目标函数通常是特定于数据的(例如,掩盖单词或旋转图像)。本研究深入探讨了在这个领域使用的常见技术和存在的...

Read More
2023-08-24 talkingdev

TOPIC开源,多目标跟踪新突破并发布复杂动作数据集BEE23

近日,一群研究者开发出一套名为TOPIC的新系统,能够通过运动和外观线索有效地在视频中跟踪多个对象。TOPIC系统不仅能够处理复杂的运动,而且还可以有效处理对象的外观变化,显著提高了多目标跟踪的准确性和效率。为...

Read More
2023-08-24 talkingdev

科学家发现新的文本到3D模型转换技术

科学家们已经找到了一种新的将文本转换为3D模型的方法,这种方法运用了特殊的技术,但有时结果并不完美。IT3D引入了一种智能策略,该策略使用多个视点和一个特殊的训练系统,使得3D创作看起来更加真实。这种技术的应...

Read More
2023-08-24 talkingdev

OneDiffusion:使扩散模型部署更简单可扩展

在生产环境中部署扩散模型一直是一个挑战,因为这些模型难以处理,且计算成本高。但是现在,OneDiffusion的出现旨在使部署和微调变得更易于管理、可扩展且可靠。OneDiffusion是一个开源项目,它的目标是使扩散模型在...

Read More
2023-08-24 talkingdev

通过Deepgram的创业计划创建、启动和扩大语音启用应用

Deepgram的创业计划为初创企业提供了高达10万美元的信用额度,以使用最强大的语音转文本API。这个计划包括对话分离、智能格式化、多语言等功能,初创企业可以立即申请。通过Deepgram的创业计划,开发者可以创建和启...

Read More
  1. Prev Page
  2. 950
  3. 951
  4. 952
  5. Next Page