数据集的相关内容 - 漫话开发者

2024-06-03 talkingdev

AI为计算机赋予嗅觉：机器学习破解气味识别难题

人类通过大约400种不同类型的嗅觉受体来体验气味。科学家们正在利用机器学习技术，帮助计算机学习某些分子或分子集合对人类的气味。机器学习在数字化气味方面至关重要，因为它可以学习将产生气味化合物的分子结构映...

2024-05-31 talkingdev

研究人员近日发布了一个名为4K-Rain13k的新数据集，这一数据集中包含了13,000对4K分辨率的图像，旨在解决超高清（UHD）图像中的去雨问题。4K-Rain13k数据集的推出，为图像处理和计算机视觉领域提供了宝贵的资源，使...

2024-05-24 talkingdev

研究人员开发了一种新的方法——全局-局部语义一致学习（Global-Local Semantic Consistent Learning，简称GLSCL），以提升文本视频检索的效率。这一创新方法不仅提高了检索的准确性，还显著降低了计算成本。GLSCL通过...

2024-05-23 talkingdev

MedLFQA是一个全新的基准数据集，旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据，帮助改进语言模型的回答精度。与此同时，OLAPH框架通过自动评估和偏好优化，训练大规...

2024-05-23 talkingdev

研究人员开发了一种名为Wav-KAN的神经网络框架，该框架采用小波函数来提升模型的可解释性和性能。与传统模型不同，Wav-KAN能够同时捕捉高频和低频数据成分，从而实现更快的训练速度和更高的稳健性。这一创新方法不仅...

2024-05-16 talkingdev

Postgres是一个流行的关系型数据库，但在处理大型数据集时可能会变得缓慢。一项新的研究表明，通过使用特定的查询优化技术，可以将Postgres查询速度提高1千倍。研究人员发现，通过使用特定的索引和优化查询语句，可...

2024-05-14 talkingdev

MoonDream最新发布COYO Captions，这是一个包含500万条全新图像描述的数据库，这些描述基于COYO数据集部分图像及其替代文本。COYO数据集是一个大型的、多元化的图像数据集，它包含了各种不同的场景和对象。通过这500...

2024-05-14 talkingdev

WebLlama是一个设计精良的模型，能够浏览网页并据此回答相关问题。这种模型可用于生成高质量的预训练数据集，或者执行需要从网页查询信息的研究。WebLlama的目标是通过模型的训练，使其能够更好地理解和处理网络信息...