清华大学知识工程组(KEG)与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目,该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...
Read MoreDeepMind最新推出的AlphaFold 3在分子结构预测领域实现重大突破,新增了对DNA、RNA及各类分子结构的预测能力,同时显著提升了复杂分子间相互作用的预测精度。这一突破性工具现通过欧洲分子生物学实验室(EMBL-EBI)...
Read More华为研究人员在arXiv最新论文中提出了一种创新性的轻量级神经应用控制技术,该技术利用视觉语言模型(VLMs)实现Android设备的应用控制,且仅需极少的额外系统配置。这一突破性进展标志着多模态AI在移动终端交互领域的...
Read MoreDeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2,这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露,R2模型将采用创新的混合架构设计,整合了稀疏专家模型(MoE)与密...
Read MoreOpenAI最新发布的o3模型展示了其通过照片猜测拍摄地点的惊人能力,这一技术突破仿佛将科幻小说中的场景带入了现实。用户只需上传一张照片,o3便能基于图像中的视觉线索(如建筑风格、植被类型、车牌信息等)进行地理...
Read MoreFacebook研究团队近日在GitHub开源了MILS项目代码,其核心突破在于证明大型语言模型(LLMs)无需额外训练即可具备跨模态感知能力。该项目论文《LLMs can see and hear without any training》提出创新方法,通过重构...
Read More近日,Hugging Face Hub发布的Omdet Turbo技术标志着实时开放词汇对象检测领域取得显著进展。该技术通过优化模型架构和算法效率,在保持高精度的同时大幅提升检测速度,解决了传统对象检测系统在动态场景中响应延迟...
Read MoreAdobe近日发布了Firefly的重大更新,此次更新不仅整合了图像、视频、音频及矢量生成工具,还新增了移动端支持,并进一步深化了与Creative Cloud的集成。这一举措标志着Adobe在创意AI领域的又一重要突破,为设计师和...
Read More