谷歌利用MaxText和Jax训练技术,同时在超过5万个芯片上进行了LLM(语言模型)训练任务,保持了66%以上的利用率,成为了最佳MFU的强有力竞争者。该项目主要基于专有技术,但其中展示了一些有趣的细节,对于其他大规模...
Read More近日,一项研究提出了一种更好的数据清洗方法,以确保LLMs的公正测试,并提高它们的可靠性。传统的数据清洗方法可能会导致LLMs训练不公平,因为某些数据可能会被错误地标记或过滤掉。这项研究提出的解决方案可以更好...
Read More受 Actor 框架的启发,这个轻量级的 Python 库使得创建基于 LLM 动力的代理变得非常容易。Langroid 多智能体编程框架(Langroid multi-agent programming framework)最近发布了他们的 GitHub Repo,使得该项目的开...
Read More由于传统主题建模技术的限制,主题建模的效果往往无法满足用户的需求,但是近日,一种名为TopicGPT的新技术正在逐渐流行。TopicGPT是一种基于LLMs的主题建模技术,通过更好的主题识别和可解释性,使得用户可以更为精...
Read More近日,研究人员提出了一种名为CLLM4Rec的全新方法,该方法通过高级预训练和新型语言嵌入,将大型语言模型与基于ID的系统相结合,提高了推荐精度。研究人员表示,CLLM4Rec的核心在于将大型语言模型与基于ID的系统相结...
Read MoreDeepspeed推出了一款新软件,旨在与vLLM和文本生成界面竞争,以快速提供语言模型服务。该软件配备了许多最先进的加速功能,初步结果表明,速度提升了2.4倍。
Read MoreGiskard是一个Python库,可以自动检测从表格模型到LLM的AI模型的漏洞,包括:性能偏见、数据泄露、虚假相关性、幻觉、毒性、安全问题等等。让您的模型快速、安全地投入生产。在GitHub上安装Giskard或在Colab中尝试。
Read More最近,一家开发团队发布了一个名为“LLM Toolkit”的开源Python工具包,用于构建基于RAG的语言模型生成应用程序。它提供了快速的RAG微调、模型训练和服务脚本,同时支持多种文本数据输入和输出格式。该工具包的代码已...
Read More