漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-16 talkingdev

Reor:一款在本地运行模型的AI笔记应用开源

Reor是一款基于人工智能的笔记应用,它在本地运行模型,从而保护用户数据隐私。该应用使用自然语言处理技术,支持用户在笔记中添加文字、图片和语音记录。它还可以自动识别笔记中的关键信息,并将其转化为可编辑的文...

Read More
2024-02-16 talkingdev

VideoAnnotator开源:结合人类专业知识的注释方法提高视频分类精度

近日,一种名为Video Annotator的框架已经在GitHub上发布。该框架通过将领域专家直接融入注释过程中,利用零样本学习和主动学习技术提高模型的精度和效率。这种注释方法不仅提高了模型的分类准确度,而且可以更好地...

Read More
2024-02-16 talkingdev

文本驱动的图像编辑无需蒙版

研究人员开发了一种基于文本提示进行图像编辑的独特方法。这种方法使用文本到图像模型和边界框生成器来识别需要编辑的区域,从而无需蒙版或草图即可进行更改。该方法可实现文本驱动的图像编辑,可以大大提高图像编辑...

Read More
2024-02-16 talkingdev

为什么“基于数据的聊天”比你想象的更难

构建特定领域、基于聊天的LLM应用和协同工具比人们想象的更具挑战性。其中一些挑战包括实现强大的性能、处理复杂的数据和复杂的查询,以及为基于LLM的聊天应用程序实现强大的数据检索。

Read More
2024-02-16 talkingdev

DALI:可信自主智能Agent框架开源

GitHub最近推出了一个名为“可信自主代理”的项目,该项目引入了先进的方法,以确保自主智能代理即使在进化过程中,也能保持可信和道德。该项目的目的是解决在生命相关应用程序中,这些代理对人类的安全和健康至关重要...

Read More
2024-02-16 talkingdev

研究人员发布关于LLM隐私的综合报告

研究人员对是否可能判断数据点是否用于训练大型语言模型进行了全面研究。他们测试了各种模型,并发现,在大多数情况下,这些攻击并不比随机猜测更好。

Read More
2024-02-16 talkingdev

Facebook发布开源音频生成模型MaGNET

近日,Facebook发布了一款最先进的开源音频模型MaGNET,该模型速度是其他替代品的7倍,而且不会影响音频质量。MaGNET模型可以生成音乐和音效。MaGNET模型的论文已经发布,更多详情请访问GitHub仓库。

Read More
2024-02-16 talkingdev

LWM-视频语言模型可回答长达小时的视频问题

近期,一种新型的视频语言模型已经问世,可以回答长达数百万词的视频问题。该模型采用环形关注机制和精细调整的7B参数模型,能够在检索基准测试中表现极其准确,胜过商业化视频语言模型。

Read More
  1. Prev Page
  2. 738
  3. 739
  4. 740
  5. Next Page