近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...
Read More近年来,开源时间序列数据库逐渐受到广泛关注,成为数据管理领域的重要组成部分。这类数据库专为处理时间序列数据而设计,具备高效的数据存储和查询能力,尤其在物联网、金融分析和监控系统等应用场景中展现出独特优...
Read MoreSpectral Compute公司近日推出了SCALE——一个通用并行图形处理单元(GPGPU)编程工具包。SCALE的主要创新之处在于它能够使得使用CUDA语言编写的程序原生编译运行在AMD的GPUs上。这个工具包接受现有的CUDA程序代码,作...
Read More据报道,Meta平台将于7月23日发布其最大规模的Llama 3模型。这款模型具备4050亿个参数,能够理解并生成图像和文本。Llama 3模型的推出,将会大大提升Meta平台的功能性。据悉,此次发布的Llama 3模型是Meta平台迄今为...
Read More最近,一种名为ChangeViT的框架引起了科技界的广泛关注。该框架采用视觉变压器(ViTs)进行遥感图像中大规模环境变化的检测。遥感技术作为一种非接触式获取地球表面信息的手段,在环境监测、气候变化研究等领域有着重...
Read More近日,一种名为TroL的新型高效大型语言和视觉模型 (LLVMs) 在GitHub上发布,其模型规模分别为18亿、38亿和70亿参数。这些模型能够精确地处理和理解大量的语言和图像信息,其性能和效率都达到了非常高的水平。这些模...
Read MoreMistral公司在追求开放性和商业成功的平衡中迈出了新的一步。他们推出了一种新的许可协议,旨在在开放共享与商业利益之间找到一个平衡点。Mistral的新许可协议称为MNPL(Mistral Non-Production License),它允许项...
Read MoreScale AI近日完成了由Accel领投的10亿美元F轮融资,之前的投资者也参与了本轮融资。作为现代人工智能数据浪潮的推动者,Scale AI所提供的服务需求十分巨大,公司在这一领域具有独特的优势。这笔巨额融资将进一步加强...
Read More