AI2发布了一个完全开放的语言模型训练框架,名为OLMo。该模型提供全面的资源,包括完整的训练数据、模型权重、训练和评估代码、每个模型超过500个检查点,以及未来的微调代码,所有这些都遵循Apache 2.0许可证。这些...
Read MoreFireLlava是一个新的开源视觉模型,经过数据训练,可以用于商业任务。它与原始Llava的性能相当,但还没有达到Llava 1.5的水平。
Read MoreMF-MOS是一种新模型,可以更好地使用LiDAR技术检测自动驾驶中的运动目标。该模型独特地分离运动和语义信息,使用残差图进行运动捕捉,使用距离图像进行语义引导。该模型的发布将进一步推动自动驾驶技术的发展。
Read MoreMonte Carlo Tree Search (MCTS)是一种先进的搜索算法。它被用于AlphaGo中,研究人员现在正在努力将其与语言模型集成。MCTS的实现一直以来都非常棘手,但是Jax的出现使得它变得更为容易。现在,开发者们可以在GitHub...
Read More本文介绍了一个基于场景和手写文本的基准测试和两个数据集。利用原始、损坏和辅助图像,全局结构引导扩散模型(GSDM)利用文本结构有效恢复清晰文本。该技术在识别准确度和图像质量方面显示出显著的改进。
Read More