阿里云近日发布了Qwen Audio模型,该模型是一款通用的音频转语言模型,能够用于音乐、语音等多种任务。该模型基于深度学习技术,经过大量数据训练,能够准确地识别语音,并将其转化为对应的语言文字,为用户提供更加...
Read More该团队创建了一个新的面向视觉的RISC-V硬件,并训练了一个超小的YOLO计算机视觉模型,实现了低功耗和极低延迟的实时物体检测。该技术可广泛应用于智能眼镜、自动驾驶、智能家居等领域。
Read More红木研究的一项研究表明,大型语言模型(LLMs)可以掌握“编码推理”,这是一种隐写术,允许LLMs在生成的文本中嵌入中间推理步骤,使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...
Read More最近,一位GitHub用户发布了一款基于GPT-V生成UI的Demo。该Demo使用了一款简单易用的手绘界面,可用于创建HTML网站。用户只需在手绘界面中简单勾画出所需的UI元素,GPT-V模型即可自动将其转化成相应的HTML代码。该De...
Read More需要将实时、低延迟的数据服务传递到边缘应用程序吗?使用NATS.io-这是许多领先金融机构、汽车、零售和政府机构使用的技术。NATS.io可以实时处理大量数据,使AI模型在任何环境中本地执行,同时专注于AI应用而不是云...
Read More近日,有学者在GitHub上发布了一项新的研究项目,名为“知识偏好对齐(KnowPAT)”,该项目旨在利用大型语言模型来改进领域特定问答系统。研究人员借助该技术,可以更加精准地针对特定领域提出问题,从而得到更加准确...
Read MoreAMBER是一个新的基准,旨在评估和降低多模式大型语言模型(MLLM)中的幻觉,而不依赖其他高级语言模型。该项目已经发布开源库,旨在帮助研究者和开发人员更好地理解和应对多模式语言模型的幻觉问题。
Read More