漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-22 talkingdev

FILCO-通过上下文过滤提升AI理解能力

近日,GitHub开源了一项名为FILCO的技术,旨在通过上下文过滤来提高人工智能系统的性能,特别是在回答问题和核查事实等领域。该技术的工作原理是选择最有用的信息,并训练模型来过滤掉不相关的细节。相比传统的人工...

Read More
2024-01-22 talkingdev

论文:人物再识别新技术:相互蒸馏学习(MDPR)

研究人员开发了一种新方法,称为相互蒸馏学习(MDPR),通过结合两种不同的技术,增强了人物再识别。该方法利用两个网络相互学习,一个网络学习到了身份特征,另一个网络学习到了外观特征,从而提高了人物再识别的准确...

Read More
2024-01-22 talkingdev

如何训练语言模型听取多模态信息

本文探讨了当前主流的预训练语言模型加入多模态功能的范式。即,在编码器和文本模型之间对齐嵌入。该方法能够让语言模型更好地理解来自视觉和听觉等多个模态的信息,从而提高其自然语言处理的能力。近年来,语言模型...

Read More
2024-01-22 talkingdev

论文:用简易数据解决难问题的训练方法

以往认为难问题需要难数据,但这些数据很难标记且带噪音。这项研究表明,对相关但易处理的数据进行微调训练,可以极大提高模型解决难问题的能力。这是支持微调训练是引出知识而非添加知识的又一数据点。本研究成果对...

Read More
2024-01-22 talkingdev

小模型公司Sakana AI获得3000万美元种子轮融资

Sakana.ai正在东京建立世界级研究实验室,以建立更小、更高效的基础模型。该公司由前谷歌研究员David Ha和Llion Jones创立,他们负责转型、世界模型和LoRA等突破性技术。它已获得了来自Lux Capital的Brandon Reeves...

Read More
2024-01-22 talkingdev

Stablecode3B:比7B的CodeLlama更出色,可在MacBook上本地运行

据悉,最近发布的Stablecode 3B模型表现出色,其强大的性能超过了7B的CodeLlama模型。同时,该模型的尺寸足够小,能够在MacBook上本地运行,无需像7B模型一样需要大量的计算资源。这一模型的发布,标志着技术领域的...

Read More
2024-01-22 talkingdev

OpenAI公布新团队:整合公众意见为其AI模型搭建‘众包’治理机制

人工智能公司OpenAI宣布组建新的“集体协调”团队,将公共意见整合到其AI模型中。该团队将与OpenAI的研究员和工程师合作,以确保其模型符合公众利益。OpenAI表示,他们希望能够通过这种方式为AI研究和应用建立一种“众...

Read More
2024-01-22 talkingdev

三星的S24和S24 Plus为智能手机注入新的AI技术

三星即将在1月31日推出的Galaxy S24和S24 Plus将具备更强大的AI功能。这些智能手机将配备最新的AI技术,使用户能够更轻松地使用他们的设备。新的AI技术将使S24和S24 Plus更加智能化,从而为用户提供更好的体验。

Read More
  1. Prev Page
  2. 786
  3. 787
  4. 788
  5. Next Page