漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-16 talkingdev

MPPE-对话状态跟踪方法助力零样本学习模型

研究人员近日开发了一种名为Mixture of Prefix Prompt Experts(MPPE)的新技术,旨在增强零样本学习模型中的对话状态跟踪能力。该方法通过转移知识至未见领域,而无需新的数据集注释。这一新技术将有助于提升机器对...

Read More
2024-04-15 talkingdev

Gemma和Siglip推出VLLM,利用LAION和LLaVA数据集进行训练

Gemma和Siglip最近发布了一款小型但功能强大的视觉语言模型(VLLM),该模型专为理解和生成与图像相关联的语言而设计。VLLM利用大规模的LAION和LLaVA数据集进行训练,这些数据集包含了大量的图像和相关文本信息,使...

Read More
2024-04-15 talkingdev

GPT引领人工智能新浪潮,初创企业受益匪浅

GPT(Generative Pre-trained Transformer)作为一种先进的自然语言处理技术,正逐渐成为人工智能领域的焦点。其最主要的价值在于极大地降低了初创企业使用机器学习功能的门槛。通过GPT,企业无需庞大的数据集或复杂...

Read More
2024-04-12 talkingdev

JetMoe:性能媲美Meta Llama 2 7B的AI模型,成本仅为10万美元

JetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...

Read More
2024-04-11 talkingdev

DataMotto:利用人工智能技术实现数据准备和清洗

DataMotto是一款创新的数据处理工具,致力于通过人工智能技术简化数据准备和清洗的过程。在大数据时代,数据的质量和可用性对于商业决策和科学研究至关重要。DataMotto通过先进的机器学习算法,自动识别数据中的异常...

Read More
2024-04-10 talkingdev

论文:OA-DG方法助力单域目标检测性能提升

在目标检测领域,单域泛化(S-DG)一直是一个挑战。为了解决这一问题,最新的OA-DG方法应运而生。该方法采用了OA-Mix数据增强技术以及OA-Loss训练策略,旨在提高模型在单域环境下的泛化能力。OA-Mix通过混合不同类别...

Read More
2024-04-05 talkingdev

Gretel开源2300万文本至SQL数据集,助力自然语言处理技术发展

HuggingFace平台上新发布了一个由Gretel收集的大规模文本至SQL数据集,包含2300万条数据。该数据集旨在通过自然语言处理技术生成SQL查询语句,对RAG应用程序和合成数据生成领域具有重要意义。文本至SQL的任务一直是...

Read More
2024-04-04 talkingdev

RealKIE发布:五个新型数据集助力企业关键信息提取

企业人工智能应用中,从数据集中提取信息至关重要。RealKIE最新发布的五个基准数据集专为衡量RAG(检索式生成)应用的算法性能而设计。这些数据集覆盖了多个行业和场景,提供了丰富的测试样本,旨在推动企业关键信息...

Read More
2024-04-03 talkingdev

HuggingFace团队揭示大规模合成数据在预训练模型中的应用

HuggingFace团队最近展示了如何为语言模型的预训练阶段生成、筛选、合成和扩展大量的合成数据。这一过程不仅涉及数据的生成,还包括对数据进行精心的筛选和过滤,以确保其在模型训练中的有效性和准确性。通过这种方...

Read More
2024-04-03 talkingdev

Chug数据集加载器:专注于文本和图像任务的高效多模态数据加载

近期,GitHub上出现了一个名为Chug的新型数据集加载器项目。Chug专注于处理文本和图像任务,提供了强大且高效的多模态数据加载能力。该工具的出现,对于从事机器学习和人工智能领域的开发者来说,无疑是一个极大的助...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page