漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-07 talkingdev

ChatDB发布NaturalSQL模型,Text-to-SQL指令性能达到最新水平

ChatDB发布了一系列名为NaturalSQL的模型,这些模型在Text-to-SQL指令上表现出最新的性能。NaturalSQL是一个基于自然语言处理的SQL查询生成器,能够将自然语言指令转化为SQL查询语句。这个开源项目已经在GitHub上开...

Read More
2024-02-07 talkingdev

论文:KTO一种新的AI对齐优化方法

Kahneman-Tversky Optimization(KTO)是一种新的方法,用于训练AI模型以更好地与人类思维对齐。通过利用Kahneman&Tversky的前景理论概念,KTO侧重于最大化效用而不仅仅是偏好可能性。这种新的方法可以帮助AI模型更...

Read More
2024-02-07 talkingdev

论文:多模态AI幻觉,解读视觉语言模型的错误描述现象

本篇论文揭示了大型视觉语言模型(LVLMs)为什么有时会错误地描述图像的原因,这种现象被称为多模态幻觉。语义转移偏差,特别是在段落中断处,是一个关键因素。研究人员发现,模型可能会出现误导性的预测,这些预测...

Read More
2024-02-07 talkingdev

阿里Qwen 1.5多语言模型发布

Qwen 1.5模型发布,参数从0.5B到72B,是一套令人印象深刻的多语言模型。有趣的是,最小的模型是第一个严肃的小于10亿参数的语言模型

Read More
2024-02-06 talkingdev

Topia-开源强大的3D生成模型

近日,一种名为3D topia的生成模型在GitHub上发布。该模型采用两阶段的过程来生成候选项,然后再对这些选定的候选项进行精细化处理。这个模型可以将文本转化为3D模型,具有很强的生成能力。目前,该模型还处于开发中...

Read More
2024-02-06 talkingdev

Ollama发布视觉模型本地部署支持

Ollama最近发布了对视觉模型的支持。Llava 1.6版本更新了支持,包括Python和JavaScript包中的视觉功能。

Read More
2024-02-06 talkingdev

AnimateLCM-高保真视频生成技术实现高质量视频创作

AnimateLCM是一种新的方法,可以通过将学习过程分成两部分来快速创建高质量的视频和改进现有的视频扩散模型。AnimateLCM的第一步是利用低复杂度的运动补偿技术来生成一个低质量的视频序列。 然后,利用一个基于自适...

Read More
2024-02-06 talkingdev

ChatLLM for VSCode成为GitHub Copilot的开源替代品

ChatLLM for VS Code是AI辅助自动完成的开源替代品。它现在支持任何Ollama模型,以及使用封闭的API模型。在这个自动化和机器学习越来越流行的时代,ChatLLM提供了一种开源替代方案,为人们提供了更多的选择。

Read More
  1. Prev Page
  2. 290
  3. 291
  4. 292
  5. Next Page