近日,LLM-Oasis作为一个大规模数据集正式发布,旨在为训练和评估系统提供支持,以检测和提升LLM(大语言模型)输出的事实性。随着LLM在自然语言处理领域的广泛应用,其生成内容的准确性和可靠性成为业界关注的焦点...
Read More近日,BadSeek项目揭示了如何在大型语言模型(LLM)中植入后门的技术细节。该项目通过深入研究LLM的embedding机制,展示了如何在不影响模型整体性能的情况下,植入特定的触发机制,从而在特定条件下激活后门功能。这...
Read More近日,一项关于表示容量极限的研究引起了广泛关注。该研究尝试将尽可能多的Token嵌入到一个固定大小的向量中,成功实现了将1568个Token压缩至单一向量。这一突破不仅展示了embedding技术的强大潜力,也为LLM和agent...
Read More近日,Gatsby的开发者团队宣布推出了一款全新的开源JavaScript agent框架——Mastra。该框架旨在为开发者提供一个高效、灵活的工具,以简化复杂agent系统的构建过程。Mastra不仅支持LLM、embedding等先进技术的集成,...
Read More近日,DeepSeek公司推出了一项名为Native Sparse Attention的创新算法技术,旨在加速传统的二次Attention计算。该技术通过硬件对齐和原生可训练的稀疏Attention机制,实现了高达11倍的计算速度提升,同时保持了整体...
Read More近日,CodeI/O技术通过将代码转换为输入输出预测格式,显著提升了大语言模型(LLM)的推理能力。该方法通过教授通用推理原则,而非依赖代码语法,从而在多种推理任务中实现了性能优化。此外,通过多轮修订进一步验证...
Read More随着AI agent技术的快速发展,其应用场景日益广泛,但同时也带来了潜在的滥用风险。近期,业界开始聚焦于如何有效检测AI agent的使用与滥用行为。通过结合LLM、embedding、LoRA和RAG等先进技术,研究人员正在开发更...
Read More2024年,科技行业回顾过去十年,发现许多机遇与挑战并存。尽管技术飞速发展,但在某些领域,我们似乎失去了宝贵的十年。从LLM的崛起到agent技术的广泛应用,再到embedding和LoRA的创新,技术的进步显而易见。然而,R...
Read More