漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-17 talkingdev

阿里云发布Qwen Audio通用音频转语言模型

阿里云近日发布了Qwen Audio模型,该模型是一款通用的音频转语言模型,能够用于音乐、语音等多种任务。该模型基于深度学习技术,经过大量数据训练,能够准确地识别语音,并将其转化为对应的语言文字,为用户提供更加...

Read More
2023-11-17 talkingdev

论文:直接偏好优化提高模型的真实性

根据偏好优化模型是促进ChatGPT普及的突破之一。类似的技术也可以用来提高模型的正确性和真实性,将医学回忆中的错误减少50%以上。

Read More
2023-11-17 talkingdev

论文:智能眼镜上的物体检测技术

该团队创建了一个新的面向视觉的RISC-V硬件,并训练了一个超小的YOLO计算机视觉模型,实现了低功耗和极低延迟的实时物体检测。该技术可广泛应用于智能眼镜、自动驾驶、智能家居等领域。

Read More
2023-11-16 talkingdev

LLM可使用隐写术隐藏推理过程

红木研究的一项研究表明,大型语言模型(LLMs)可以掌握“编码推理”,这是一种隐写术,允许LLMs在生成的文本中嵌入中间推理步骤,使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

Read More
2023-11-16 talkingdev

一个开源的GPT-V生成UI的Demo

最近,一位GitHub用户发布了一款基于GPT-V生成UI的Demo。该Demo使用了一款简单易用的手绘界面,可用于创建HTML网站。用户只需在手绘界面中简单勾画出所需的UI元素,GPT-V模型即可自动将其转化成相应的HTML代码。该De...

Read More
2023-11-16 talkingdev

Synadia: 使用NATS.io在边缘实现人工智能

需要将实时、低延迟的数据服务传递到边缘应用程序吗?使用NATS.io-这是许多领先金融机构、汽车、零售和政府机构使用的技术。NATS.io可以实时处理大量数据,使AI模型在任何环境中本地执行,同时专注于AI应用而不是云...

Read More
2023-11-16 talkingdev

Knowpat-特定领域的AI问答系统开源

近日,有学者在GitHub上发布了一项新的研究项目,名为“知识偏好对齐(KnowPAT)”,该项目旨在利用大型语言模型来改进领域特定问答系统。研究人员借助该技术,可以更加精准地针对特定领域提出问题,从而得到更加准确...

Read More
2023-11-16 talkingdev

降低多模态语言模型的幻觉: AMBER发布开源库

AMBER是一个新的基准,旨在评估和降低多模式大型语言模型(MLLM)中的幻觉,而不依赖其他高级语言模型。该项目已经发布开源库,旨在帮助研究者和开发人员更好地理解和应对多模式语言模型的幻觉问题。

Read More
  1. Prev Page
  2. 334
  3. 335
  4. 336
  5. Next Page