近日,Character AI在其大规模推理系统中成功减少了KV缓存的使用,并在一个简化版的GPT模型中实现了这一优化。通过这一技术改进,内存使用量减少了40%。这一优化不仅提升了系统的运行效率,还为未来更大规模的AI模型...
Read More近日,EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相,旨在评估多模态大语言模型(MLLMs)在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务,这对模型的感知、推理和执行能力提...
Read More近日,XLabs宣布在强大的Flux模型基础上训练了一系列实用的LoRA模型,其中最受欢迎的是真实感模型。这些LoRA模型通过优化embedding技术,显著提升了生成内容的质量和多样性。真实感模型在图像生成和文本处理领域表现...
Read More科技界瞩目的人工智能公司DeepSeek正加快步伐,提前推出其备受期待的R2模型。原先计划于5月初发布R2模型的DeepSeek,现决定提前发布日期。新一代R2模型有望在编码技能上有所提升,并且能够处理除英语外的其他语言。...
Read More近日,科学家们成功绘制了黑洞内部混沌时空的新地图,这一突破性研究为我们理解黑洞内部的极端物理环境提供了新的视角。通过先进的数学模型和计算机模拟,研究人员揭示了黑洞内部时空的复杂结构和动态变化。这些新地...
Read More近日,一项名为Text4VPR的创新技术成功将视觉与语言结合,为移动机器人提供了仅通过文本描述即可实现地点识别的能力。这一技术突破了传统视觉定位的局限,使得机器人在复杂环境中能够更高效地识别和定位目标地点。Te...
Read More近日,Moonshot发布了一项名为Block Attention混合算法的创新技术,该算法在长上下文语言模型(LLM)中的应用表现卓越,被认为可与NSA相媲美。Block Attention混合算法通过优化注意力机制,显著提升了模型在处理长文...
Read More近日,LLM-SRec技术通过将用户序列行为直接整合到LLM(大语言模型)中,显著提升了推荐系统的准确性,且无需进行额外的模型微调。这一创新方法不仅简化了推荐系统的开发流程,还实现了推荐精度的新突破,成为当前推...
Read More