NVIDIA在GitHub开源项目TensorRT-LLM中发布了名为Auto Deploy的创新工具,该技术实现了将PyTorch和Hugging Face模型转化为高效可部署格式的重大突破。通过TensorRT-LLM的优化编译器,模型推理速度可提升数倍,特别适...
Read MoreOpenAI近日将其内部研发的高性能计算核心——FP4(4-bit浮点)与MoE(混合专家)系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展:FP4作为新兴的低精度计算格式可显著提升...
Read More近日,技术领域迎来了一款名为Clolog的新平台,尽管目前公开信息有限,但其名称已引发业界广泛猜测与讨论。业内人士分析,Clolog可能涉及前沿技术整合,或将在AI、大数据或云计算领域带来创新解决方案。其命名风格与...
Read More由Tianyi实验室发布的C3PO项目在GitHub开源了一种创新的测试时优化技术,该技术通过基于相似参考样本重新混合专家权重,显著提升了混合专家(Mixture-of-Experts,MoE)大语言模型的准确性。这一突破性方法不仅优化...
Read More当前大多数针对连续信号的生成模型由于计算限制,通常需要在潜在空间中进行操作。然而,这项研究引入了一系列级联结构,使得生成过程可以直接在像素空间中进行。这一创新不仅显著提升了生成效率,还消除了对预训练变...
Read MoreInteractVLM作为新一代视觉语言模型(VLM),实现了从2D到3D的交互推理跨越。该模型通过创新性地利用强大的基础模型,结合多视角渲染技术,将2D推理能力提升至3D空间,能够精准分析人类与物体在三维环境中的接触关系。...
Read More近日,一项创新性技术方案引发开发者社区关注:通过单一SQLite数据库表与少量cron定时任务即可构建完全可定制的AI助手系统。该方案突破传统AI agent复杂的架构设计,仅需基础组件即可实现对话记忆、任务调度等核心功...
Read More近日,一项名为Zero-codegen的技术引发开发者社区广泛关注。该技术实现了无需代码生成和编译步骤,直接在TypeScript中完成Protobufs的类型推断。这一突破性进展显著简化了开发流程,使开发者能够更高效地在TypeScrip...
Read More