Rabbit近日展示了其AI agent控制Android应用的能力,实现了其早期R1发布时的承诺。该AI能够执行诸如查找视频和收集鸡尾酒配料等任务,尽管目前仍存在一些效率问题。Rabbit表示将继续优化这一agent,并计划在不久的将...
Read More近日,一款基于DiNO 2的视线估计算法在GitHub上开源,该算法能够高效地估计人们的视线方向,为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点,可以广泛应用于零售场景中的消费者行...
Read More近日,R1-OneVision作为一种多功能的大型多模态模型,正式在GitHub上发布。该模型通过整合视觉与文本数据,在数学、科学、深度图像理解及逻辑推理等复杂任务中表现出色。R1-OneVision的设计旨在解决传统单一模态模型...
Read More近日,一款名为LightningDiT的高效模块化扩散模型工具包在GitHub上发布,旨在为生成式AI应用提供可扩展且多功能的解决方案。LightningDiT通过优化模型架构和训练流程,显著提升了生成式AI的性能和效率。该工具包支持...
Read More近日,Character AI在其大规模推理系统中成功减少了KV缓存的使用,并在一个简化版的GPT模型中实现了这一优化。通过这一技术改进,内存使用量减少了40%。这一优化不仅提升了系统的运行效率,还为未来更大规模的AI模型...
Read More近日,EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相,旨在评估多模态大语言模型(MLLMs)在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务,这对模型的感知、推理和执行能力提...
Read More近日,XLabs宣布在强大的Flux模型基础上训练了一系列实用的LoRA模型,其中最受欢迎的是真实感模型。这些LoRA模型通过优化embedding技术,显著提升了生成内容的质量和多样性。真实感模型在图像生成和文本处理领域表现...
Read More科技界瞩目的人工智能公司DeepSeek正加快步伐,提前推出其备受期待的R2模型。原先计划于5月初发布R2模型的DeepSeek,现决定提前发布日期。新一代R2模型有望在编码技能上有所提升,并且能够处理除英语外的其他语言。...
Read More