近日,GitHub上开源了一个名为ViBT(Vision Bridge Transformer)的项目,该项目将布朗桥模型(Brownian Bridge Models)扩展至高达200亿参数规模,专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...
Read More近日,长期开发iOS照片应用的科技团队LateNiteSoft发布了一项针对三大前沿AI图像生成模型的深度评测。该研究通过600余次真实场景的图像生成测试,系统评估了OpenAI的gpt-image-1、Google的nanoBanana(Gemini)以及S...
Read MoreSnapchat正式向美国所有用户免费开放其人工智能驱动的「Imagine Lens」功能,这标志着该平台首次将开放式提示词AI图像编辑工具从付费订阅模式转向全民普惠。该技术允许用户通过输入自定义文本指令,实时生成或编辑Sn...
Read More近日,游戏开发领域出现重要技术建议:开发者应停止使用PNG格式存储和传输游戏纹理资源。根据专业技术分析,PNG格式虽具有无损压缩特性,但并非为实时图形渲染场景设计。新兴纹理格式KTX2和DDS凭借其专为GPU定制的技...
Read MoreFLUX.1 Kontext [dev]作为一款拥有120亿参数的开源模型,突破性地在消费级硬件上实现了媲美商业闭源软件的图像编辑性能。该模型采用FLUX.1非商业许可协议开放权重,为学术研究和非商业应用提供免费访问权限。技术亮...
Read MoreTogether AI宣布在其Serverless Inference API和专用端点服务中集成两大前沿AI模型:DeepSeek R1-0528语言模型与FLUX.1 Kontext图像生成系统。DeepSeek R1-0528通过升级的推理能力、函数调用支持及代码生成优化,显...
Read MorePixelFlow是近期在GitHub上开源的一个创新图像生成模型,其最大特点是直接在像素空间生成图像,无需依赖变分自编码器(VAE)。这一技术突破带来了显著的图像质量提升和更精细的语义控制能力,同时在生成效率和基准测...
Read More字节跳动最新发布的开源多模态基础模型BAGEL在技术领域引发广泛关注。该模型原生支持多模态理解与生成任务,在开源统一模型中表现优异。BAGEL展现出先进的跨模态推理能力,包括图像编辑、3D场景操作和世界导航等复杂...
Read More