近日,R1-OneVision作为一种多功能的大型多模态模型,正式在GitHub上发布。该模型通过整合视觉与文本数据,在数学、科学、深度图像理解及逻辑推理等复杂任务中表现出色。R1-OneVision的设计旨在解决传统单一模态模型...
Read More近日,一款名为LightningDiT的高效模块化扩散模型工具包在GitHub上发布,旨在为生成式AI应用提供可扩展且多功能的解决方案。LightningDiT通过优化模型架构和训练流程,显著提升了生成式AI的性能和效率。该工具包支持...
Read More近日,Character AI在其大规模推理系统中成功减少了KV缓存的使用,并在一个简化版的GPT模型中实现了这一优化。通过这一技术改进,内存使用量减少了40%。这一优化不仅提升了系统的运行效率,还为未来更大规模的AI模型...
Read More近日,EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相,旨在评估多模态大语言模型(MLLMs)在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务,这对模型的感知、推理和执行能力提...
Read More近日,XLabs宣布在强大的Flux模型基础上训练了一系列实用的LoRA模型,其中最受欢迎的是真实感模型。这些LoRA模型通过优化embedding技术,显著提升了生成内容的质量和多样性。真实感模型在图像生成和文本处理领域表现...
Read More科技界瞩目的人工智能公司DeepSeek正加快步伐,提前推出其备受期待的R2模型。原先计划于5月初发布R2模型的DeepSeek,现决定提前发布日期。新一代R2模型有望在编码技能上有所提升,并且能够处理除英语外的其他语言。...
Read MoreGgwave是一款创新的微型数据声波传输库,旨在通过声波实现设备间的数据传输。该技术利用声波作为载体,能够在无需网络连接的情况下,实现短距离的数据传输。Ggwave的设计轻巧高效,适用于多种场景,如物联网设备、智...
Read More近日,Chicory作为一款JVM原生的WebAssembly运行时技术,引起了广泛关注。WebAssembly(Wasm)作为一种高效的二进制指令格式,旨在为Web应用提供接近原生的性能。Chicory的独特之处在于其直接在Java虚拟机(JVM)上...
Read More