Google Titans模型是Google最新推出的一种内存驱动AI架构,旨在通过高效的内存管理和数据处理能力,提升AI模型的性能和效率。该模型的核心在于其独特的内存驱动设计,能够显著减少数据访问延迟,从而加速模型训练和...
Read More近日,社区推出了一款名为Flex 1的图像生成模型,该模型基于Flux Schnell进行微调,并采用Apache许可证。Flex 1的设计参数为8B,能够在保持高性能的同时实现快速运行。这一模型的推出为图像生成领域提供了新的工具,...
Read More近日,Open Reasoner Zero项目在GitHub上正式发布,该项目旨在复现零推理(Zero Reasoning)范式,并提供了完整的开源资源,包括训练数据、脚本和模型权重。零推理是一种新兴的人工智能推理方法,旨在通过简化推理过...
Read More近日,一项名为Model-Guidance(MG)的技术在扩散模型训练领域取得了突破性进展。该技术通过引入后验概率优化目标,显著提升了扩散模型的训练速度和推理效率。实验结果显示,采用MG技术的扩散模型在ImageNet 256基准...
Read More近日,Qwen团队发布了Qwen 2.5 VL技术报告,详细介绍了其最新研发的视觉语言模型。该模型被誉为目前最强的开源权重视觉语言模型,具备卓越的多模态处理能力,能够高效地理解和生成图像与文本的结合内容。Qwen 2.5 VL...
Read More近日,DeepSeek公司推出了一项名为Native Sparse Attention的创新算法技术,旨在加速传统的二次Attention计算。该技术通过硬件对齐和原生可训练的稀疏Attention机制,实现了高达11倍的计算速度提升,同时保持了整体...
Read More近日,CodeI/O技术通过将代码转换为输入输出预测格式,显著提升了大语言模型(LLM)的推理能力。该方法通过教授通用推理原则,而非依赖代码语法,从而在多种推理任务中实现了性能优化。此外,通过多轮修订进一步验证...
Read MoreOpenAI近日宣布与SoftBank合作,利用AI技术自动化白领工作流程,这一举措引发了关于大规模失业的广泛讨论。与此同时,OpenAI还推出了一款新的AI agent用于研究,并发布了o3-mini推理模型。欧盟则对高风险AI系统实施...
Read More