OpenAI近日将其内部研发的高性能计算核心——FP4(4-bit浮点)与MoE(混合专家)系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展:FP4作为新兴的低精度计算格式可显著提升...
Read More谷歌近日基于其Gemma模型系列推出了专为医疗科学领域优化的TxGemma开源模型。该模型在治疗方案的发现方面展现出卓越性能,不仅超越了大多数专用模型,还在所有开源通用模型中表现最佳。TxGemma的发布标志着人工智能...
Read More近日,Gemini和Whisk两大平台宣布集成Veo 2技术,为用户提供更强大的视频生成能力。Veo 2作为新一代视频生成工具,通过先进的AI算法,能够快速生成高质量的视频内容,满足用户在营销、教育、娱乐等多领域的需求。此...
Read More由Tianyi实验室发布的C3PO项目在GitHub开源了一种创新的测试时优化技术,该技术通过基于相似参考样本重新混合专家权重,显著提升了混合专家(Mixture-of-Experts,MoE)大语言模型的准确性。这一突破性方法不仅优化...
Read More近期发表于arXiv的研究ThinkLite-VL通过创新性地应用蒙特卡洛树搜索(MCTS)技术量化样本难度,在视觉语言模型(VLM)领域取得突破性进展。该方法仅需11,000个训练样本即可显著提升模型推理能力,且无需依赖知识蒸馏...
Read MoreInteractVLM作为新一代视觉语言模型(VLM),实现了从2D到3D的交互推理跨越。该模型通过创新性地利用强大的基础模型,结合多视角渲染技术,将2D推理能力提升至3D空间,能够精准分析人类与物体在三维环境中的接触关系。...
Read More字节跳动团队最新发布的论文展示了如何在655k H100小时的“适度”计算预算下,训练出一个具有竞争力的70亿参数视频生成模型Seaweed-7B。该模型在多项时间敏感任务中表现出色,展现了强大的视频生成能力。这一突破不仅...
Read MoreOpenAI近日在其API中推出了三款全新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编码和指令遵循方面表现优异,全面超越了之前的GPT-4o和GPT-4o mini。新模型不仅具备更大的上下文窗口,支持高达100万toke...
Read More