近日,Qwen团队发布了Qwen 2.5 VL技术报告,详细介绍了其最新研发的视觉语言模型。该模型被誉为目前最强的开源权重视觉语言模型,具备卓越的多模态处理能力,能够高效地理解和生成图像与文本的结合内容。Qwen 2.5 VL...
Read MorexAI公司近日发布了其最新旗舰人工智能模型Grok 3,并展示了针对iOS和网页应用的新功能。Grok 3的训练使用了位于孟菲斯的庞大数据中心,该中心配备了约20万个GPU。Grok 3系列模型包括:Grok 3 mini,它以牺牲部分准确...
Read More近日,一项名为Mask-Enhanced Autoregressive Prediction(MEAP)的技术在GitHub上发布,该技术通过将Masked Language Modeling(MLM)整合到仅解码器的Transformer中,显著提升了信息检索任务的性能,同时保持了强...
Read More近日,GitHub上发布了一个专门用于评估AI模型在复杂函数调用方面表现的基准测试工具库。该工具库旨在为研究人员和开发者提供一套全面的测试框架,以衡量不同LLM在处理复杂函数调用时的性能。通过这一工具,用户可以...
Read MoreDeepMind近期在视觉语言模型(VLM)预训练领域取得了重大突破,将训练数据规模提升至前所未有的1000亿张图像。这一规模远超以往尝试,显著提升了模型在多样化全球任务中的表现。尽管在西方中心化任务上的性能已趋于...
Read More近日,Hugging Face宣布尝试复现OpenAI的深度研究成果,特别是其基于agentic的web-search框架。该框架在GAIA基准测试中表现卓越,显著提升了性能。为了推动开源生态的发展,Hugging Face进行了一项长达24小时的实验...
Read More近日,Virtuoso Small在性能测试中表现优异,成功超越新发布的Phi 4模型。尽管两者在权重数量上相同,但Virtuoso Small在基准测试中得分更高,尤其是在实际任务中表现更为出色。Phi模型依赖的合成数据在某些场景下可...
Read MoreLOKI 是一个用于评估视觉语言模型(VLMs)在检测新颖和具有挑战性项目方面表现的合成基准测试工具。该基准测试通过生成复杂的多模态数据,帮助研究人员更好地理解模型在处理未知或复杂场景时的能力。LOKI 的设计旨在...
Read More