微软近日发布了其广受欢迎的截图解析工具OmniParser的重大版本更新——OmniParser v2.0。作为一款领先的视觉信息处理工具,新版本在Screenshot Pro基准测试中表现优异,展现了微软在计算机视觉和自然语言处理领域的技...
Read More微软近日发布了Phi-4-reasoning系列变体,这一创新标志着小型语言模型(SLMs)在效率与复杂推理能力上的重大进展。Phi-4-reasoning通过算法优化和架构改进,在保持参数规模精简的同时,实现了接近大型语言模型(LLMs...
Read More微软最新发布的《2025年度工作趋势指数》报告揭示了企业向AI驱动的“前沿企业”(Frontier Firms)转型的重大趋势。报告重点强调了三大核心变革:1)智能随需(intelligence on tap)将成为企业标配,AI能力将像水电一...
Read More微软DeepSpeed团队在GitHub开源了DeepCompile项目,通过引入编译技术显著提升分布式训练性能。该项目针对训练过程中的瓶颈操作进行深度优化,采用改进版的torch compile实现算子融合与代码生成,实测可使关键操作获...
Read More微软CEO萨提亚·纳德拉在宣布公司800亿美元AI投资计划后,强调了将AI研究转化为成功产品的重要性。微软正致力于提升其AI产品(如Copilot和Muse)的性能,同时确保投资方向与可持续发展目标保持一致。尽管AI工作负载增...
Read More在Windows 10/11的大规模部署中,autounattend.xml文件是实现无人值守安装的关键配置文件。该XML文件通过预设安装参数(如分区方案、区域设置、用户账户等),显著提升系统部署效率。技术人员可使用Windows System I...
Read MoreGitHub热门项目Awesome Vision-to-Music Generation系统性地整理了视觉到音乐(V2M)生成领域的前沿进展,涵盖学术研究突破与工业级应用方案。该项目持续更新的资源库整合了三大核心要素:1)基于深度学习的跨模态生...
Read More微软研究院最近推出了一项名为KBLAM的创新技术,旨在为大型语言模型(LLMs)引入即插即用的外部知识。这项技术的主要亮点在于,它无需重新训练模型即可实现知识的无缝集成,从而支持在线和实时学习。KBLAM的核心优势...
Read More