Anthropic Labs今日正式发布Claude Design,标志着生成式AI在专业视觉创作领域迈出关键一步。该产品基于Claude Opus 4.7多模态视觉模型构建,能够协助用户高效生成设计原型、商业演示文稿、营销单页等视觉内容。其核...
Read More百度近期在GitHub上开源了其企业级视觉语言模型系列——千帆VL(Qianfan-VL)。该系列模型并非通用型多模态模型的简单变体,而是针对工业场景进行了深度优化和增强的专用模型。其核心设计目标是解决企业级应用中的实际...
Read More微软近日发布了Phi-4-reasoning-vision-15B,这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数,却在数学、科学、文档及用户界面(UI)推理任务上,达到了与参数量大数倍的模型相当甚至更优的性...
Read MoreMeta旗下PyTorch团队正式开源ExecuTorch项目,这是一个专为在移动设备、嵌入式系统和边缘计算节点上高效部署人工智能模型而设计的端到端解决方案。ExecuTorch旨在解决AI模型在资源受限环境中的部署难题,其核心价值...
Read More人工智能领域迎来重要开源进展。Mistral AI正式发布了其新一代Mistral 3系列模型,该系列包含两大技术路线:一是三款不同规模的密集模型(参数规模分别为140亿、80亿和30亿),二是备受瞩目的Mistral Large 3稀疏混...
Read More开发者gavrielc基于谷歌最新Gemini 3 Pro Image模型(代号Nano Banana)推出开源CLI工具Nano PDF,实现了通过自然语言指令直接编辑PDF文档的技术突破。该工具将指定PDF页面转换为图像,结合用户文本提示调用多模态AI...
Read More谷歌正式推出其迄今最智能的AI模型Gemini 3,标志着人工智能技术进入全新发展阶段。该模型通过突破性的多模态推理能力,可帮助用户将任意创意转化为现实解决方案。Gemini 3在核心AI基准测试中全面超越前代产品,其创...
Read More近日,长期开发iOS照片应用的科技团队LateNiteSoft发布了一项针对三大前沿AI图像生成模型的深度评测。该研究通过600余次真实场景的图像生成测试,系统评估了OpenAI的gpt-image-1、Google的nanoBanana(Gemini)以及S...
Read More