Hugging Face平台最新发布的SIFT-50M(Speech Instruction Fine-Tuning)数据集,是一个包含5000万样本的大规模语音指令微调数据集,专为语音-文本大语言模型(LLMs)的指令微调和预训练而设计。该数据集基于公开可...
Read MorePrima CPP是llama.cpp的一个扩展项目,旨在通过内存映射(mmaping)技术,使大型模型能够在低内存环境中高效运行。这一技术突破为资源受限的设备部署先进AI模型提供了可能,尤其适用于边缘计算和移动端场景。通过优...
Read More由Tianyi实验室发布的C3PO项目在GitHub开源了一种创新的测试时优化技术,该技术通过基于相似参考样本重新混合专家权重,显著提升了混合专家(Mixture-of-Experts,MoE)大语言模型的准确性。这一突破性方法不仅优化...
Read More机器学习作为人工智能的核心技术之一,近年来在学术界和工业界均取得了显著进展。本文从理论基础出发,系统性地介绍了机器学习的核心概念、算法分类及实际应用场景。监督学习、无监督学习和强化学习三大范式构成了机...
Read More近日,一项名为Guidance-Free Training(GFT)的技术突破引发计算机视觉领域关注。该技术通过完全消除对Classifier-Free Guidance(CFG)的依赖,在保持生成质量的同时显著降低计算成本。与传统基于蒸馏的方法不同,...
Read More随着AI技术的快速发展,agentic coding正逐渐成为软件开发领域的新趋势。在这一过程中,开发者的技能水平显得尤为重要。agentic coding不仅要求开发者具备传统的编程能力,还需要他们熟悉LLM、embedding等先进技术,...
Read MoreMidjourney近期发布了一项重要工作,旨在提升创意写作模型的多样性表现。该团队通过对一个较小的7B模型进行后训练,使其在创意写作任务中的表现超越了更大规模的开放和封闭模型。这一突破不仅展示了模型优化技术的潜...
Read MoreHugging Face 团队近日发布了其 DeepSeek 推理模型的开源复制项目 OpenR1 的最新更新。此次更新揭示了一个有趣的发现:当针对竞争性编程进行专门调优时,小型模型的表现可以超越更大规模的模型。这一发现不仅挑战了...
Read More