近日,一项名为Text4VPR的创新技术成功将视觉与语言结合,为移动机器人提供了仅通过文本描述即可实现地点识别的能力。这一技术突破了传统视觉定位的局限,使得机器人在复杂环境中能够更高效地识别和定位目标地点。Te...
Read More梁文峰,一位对冲基金经理,推出了自筹资金的开源AI平台DeepSeek,该平台因其创新的LLM(如DeepSeek-R1)而迅速获得全球关注,这些模型可与OpenAI的模型相媲美。DeepSeek采用更具成本效益的训练方法,并兼容消费级硬...
Read More近日,一项名为Model-Guidance(MG)的技术在扩散模型训练领域取得了突破性进展。该技术通过引入后验概率优化目标,显著提升了扩散模型的训练速度和推理效率。实验结果显示,采用MG技术的扩散模型在ImageNet 256基准...
Read More近日,一项关于表示容量极限的研究引起了广泛关注。该研究尝试将尽可能多的Token嵌入到一个固定大小的向量中,成功实现了将1568个Token压缩至单一向量。这一突破不仅展示了embedding技术的强大潜力,也为LLM和agent...
Read More近日,fal成功完成了由Notable Capital领投的4900万美元B轮融资,a16z等机构也参与了本轮投资,使得公司总融资额达到7200万美元。fal致力于扩展其AI驱动的生成媒体平台,特别是在视频内容领域,服务于广告和游戏等行...
Read More近日,一款名为Schemesh的新型工具引起了技术界的广泛关注。Schemesh成功地将Unix shell与Lisp REPL(Read-Eval-Print Loop)进行了深度融合,为开发者提供了一种全新的交互式编程体验。Unix shell以其强大的命令行...
Read More近日,Jakiro团队通过引入Mixture of Experts(MoE)技术,成功优化了Speculative Decoding的性能。该方法通过生成多样化的预测结果,减少了候选预测之间的相关性,从而显著提升了推理速度。Speculative Decoding作...
Read More近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...
Read More