近日,GitHub上发布了一个名为CoT-UQ的创新框架,该框架旨在为大型语言模型(LLM)提供响应层面的不确定性量化。CoT-UQ通过集成链式思维(Chain-of-Thought, CoT)推理,能够更精确地评估模型在生成响应时的置信度。...
Read More近日,DeepSeek在GitHub上发布了名为DualPipe的开源项目,展示了其在模型并行计算领域的最新研究成果。DualPipe采用了一种新颖的并行策略,旨在优化模型的计算与通信重叠,从而显著提升整体性能。这一策略通过高效的...
Read MoreAllen AI近日宣布,其通过持续微调Qwen VL模型,成功训练出一款强大的PDF文本提取工具——OlmOCR。该模型基于超过20万份PDF文档进行训练,能够高效、精准地提取PDF中的文本内容。OlmOCR的推出标志着PDF文本提取技术的...
Read More近日,一款名为LightningDiT的高效模块化扩散模型工具包在GitHub上发布,旨在为生成式AI应用提供可扩展且多功能的解决方案。LightningDiT通过优化模型架构和训练流程,显著提升了生成式AI的性能和效率。该工具包支持...
Read More近日,LLM-Oasis作为一个大规模数据集正式发布,旨在为训练和评估系统提供支持,以检测和提升LLM(大语言模型)输出的事实性。随着LLM在自然语言处理领域的广泛应用,其生成内容的准确性和可靠性成为业界关注的焦点...
Read MoreDeepEval是一个开源框架,专注于评估和测试大型语言模型系统。它整合了最新的研究成果,通过本地运行的模型来评估模型输出。DeepEval支持通过RAG、微调、LangChain、LlamaIndex等多种方式实现的应用。该框架可帮助开...
Read More近日,GitHub上发布了一个专门用于评估AI模型在复杂函数调用方面表现的基准测试工具库。该工具库旨在为研究人员和开发者提供一套全面的测试框架,以衡量不同LLM在处理复杂函数调用时的性能。通过这一工具,用户可以...
Read More近日,Reqo推出了一款全新的查询优化模型,该模型结合了双向图神经网络(Bi-GNN)与概率机器学习(ML)技术,旨在提升查询成本估算的准确性。与传统方法不同,Reqo引入了一种创新的可解释性技术,能够突出查询子图的...
Read More