近日,SubPOP发布了一个大规模数据集,专门用于微调LLM(大语言模型),以预测调查响应分布。该数据集通过减少预测差距,显著提升了模型在未见过的调查数据上的泛化能力。这一技术突破为公众意见预测提供了更精准的...
Read More近日,AISafetyLab在GitHub上发布了一个全面的AI安全框架,旨在为研究人员和开发者提供一套完整的工具集,以应对AI系统中的安全问题。该框架不仅包含了多种模型和数据集,还提供了实用的工具和一系列与AI安全相关的...
Read More近日,技术社区对SWE-bench数据集的使用提出了严重关切。该数据集被广泛用于评估软件工程领域的模型性能,但近期发现其存在多个关键问题,可能影响研究结果的准确性和可靠性。首先,数据集中部分样本的标注存在偏差...
Read More近日,LLM-Oasis作为一个大规模数据集正式发布,旨在为训练和评估系统提供支持,以检测和提升LLM(大语言模型)输出的事实性。随着LLM在自然语言处理领域的广泛应用,其生成内容的准确性和可靠性成为业界关注的焦点...
Read More近日,一项名为Model-Guidance(MG)的技术在扩散模型训练领域取得了突破性进展。该技术通过引入后验概率优化目标,显著提升了扩散模型的训练速度和推理效率。实验结果显示,采用MG技术的扩散模型在ImageNet 256基准...
Read MoreMistral Saba是一款基于中东和南亚地区精心策划数据集训练的24B参数模型。尽管其规模仅为同类模型的五分之一,但Mistral Saba在提供更准确和相关响应方面表现出色,同时显著降低了计算成本和响应时间。这一突破性技...
Read More近日,Google Cloud宣布其数据仓库服务BigQuery正式推出SQL管道语法的公共预览版。这一新功能允许用户在SQL查询中使用管道符号(|)来简化复杂的数据处理流程。通过管道语法,用户可以将多个操作串联起来,例如数据...
Read More微软近日在GitHub上发布了一款名为Data Formulator的工具,该工具利用语言模型(LLM)帮助用户快速生成图表并回答与数据集相关的问题。Data Formulator通过API密钥与云端模型连接,能够高效处理数据分析和可视化任务...
Read More