漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-08 talkingdev

MetaVoice-开源13亿文本到语音模型

Meta Voice 是一个小而强大的文本到语音模型,支持生成和语音克隆。该模型基于深度神经网络和自回归模型,可用于多种应用场景,如语音合成、语音助手等。此外,Meta Voice 还支持多种语言,包括英语、中文、日语等。...

Read More
2024-02-08 talkingdev

开源数学推理AI模型DeepSeekMath

GitHub仓库发布了一个名为DeepSeekMath 7B的语言模型,专门设计用于解决复杂的数学问题。该模型训练了大量以数学为重点的内容,它可以理解数学问题的语法和语义,并根据其推理出答案。DeepSeekMath 7B是一个重要的AI...

Read More
2024-02-08 talkingdev

BriaAI开源最先进的背景去除模型

Bria AI公司已经开源了其背景去除模型和工具,包括训练数据混合和性能指标。该模型是相比其他开源模型的重大改进。这个模型可以轻松去除图像背景,使得用户可以更方便地进行后期处理,并且可以应用于诸如视频会议、...

Read More
2024-02-08 talkingdev

论文:新工具解决多模态LLM中的幻觉问题

针对多模态大语言模型(MLLM)中的幻觉问题,研究人员开发了MHaluBench,一个新的评估幻觉检测方法的基准。该工具可以帮助研究人员更好地评估语言模型的幻觉能力,从而有效提高模型的质量和准确性。目前,该工具已经...

Read More
2024-02-08 talkingdev

移动端本地微型语言模型大有可为

近日,一项研究探讨了如何通过采用参数更少的微型语言模型,使得强大的语言模型更适合移动设备。研究人员发现,相较于传统的大型语言模型,微型语言模型在保证语言表达能力的前提下,可以极大地减少模型参数,从而显...

Read More
2024-02-08 talkingdev

论文:CLIP模型使用全合成数据进行训练

由于LAION等大规模数据集的删除,以及版权问题,使得训练大规模图像模型变得具有挑战性。但是,这项工作表明,使用3000万个全合成的图像可以训练出强大的CLIP模型

Read More
2024-02-07 talkingdev

Roblox发布实时AI聊天翻译器,打破语言壁垒

Roblox开发了一种AI模型,能够实时翻译16种语言的文本聊天,以打破语言壁垒,增强用户参与度。该模型利用基于转换器的大型语言模型,在混合专家架构中实现了高效的资源利用,同时保持了其隐私和安全流程。

Read More
2024-02-07 talkingdev

Nomic-Embed-Text-V1:全新文本嵌入模型的里程碑

Nomic-Embed-Text-V1是一种开源、完全可重现的文本嵌入模型,为短文本和长文本任务树立了新的标杆。在透明度方面独树一帜,Nomic-Embed-Text-V1提供完全访问其训练代码、模型权重和包含2.35亿个文本对的大型数据集的...

Read More
  1. Prev Page
  2. 289
  3. 290
  4. 291
  5. Next Page