漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-13 talkingdev

DeepScaleR:通过扩展RL训练,1.5B模型超越O1-Preview

近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...

Read More
2024-09-15 talkingdev

开源时间序列数据库的崛起

近年来,开源时间序列数据库逐渐受到广泛关注,成为数据管理领域的重要组成部分。这类数据库专为处理时间序列数据而设计,具备高效的数据存储和查询能力,尤其在物联网、金融分析和监控系统等应用场景中展现出独特优...

Read More
2024-07-16 talkingdev

SCALE工具包发布:GPU编程新纪元

Spectral Compute公司近日推出了SCALE——一个通用并行图形处理单元(GPGPU)编程工具包。SCALE的主要创新之处在于它能够使得使用CUDA语言编写的程序原生编译运行在AMD的GPUs上。这个工具包接受现有的CUDA程序代码,作...

Read More
2024-07-15 talkingdev

传言Meta将于7月23日发布最大规模的Llama 3模型

据报道,Meta平台将于7月23日发布其最大规模的Llama 3模型。这款模型具备4050亿个参数,能够理解并生成图像和文本。Llama 3模型的推出,将会大大提升Meta平台的功能性。据悉,此次发布的Llama 3模型是Meta平台迄今为...

Read More
2024-06-21 talkingdev

遥感变化检测技术进步:ChangeViT助力大规模环境变化检测

最近,一种名为ChangeViT的框架引起了科技界的广泛关注。该框架采用视觉变压器(ViTs)进行遥感图像中大规模环境变化的检测。遥感技术作为一种非接触式获取地球表面信息的手段,在环境监测、气候变化研究等领域有着重...

Read More
2024-06-20 talkingdev

TroL-高效大型语言和视觉模型开源

近日,一种名为TroL的新型高效大型语言和视觉模型 (LLVMs) 在GitHub上发布,其模型规模分别为18亿、38亿和70亿参数。这些模型能够精确地处理和理解大量的语言和图像信息,其性能和效率都达到了非常高的水平。这些模...

Read More
2024-05-30 talkingdev

Mistral推出新型AI非生产许可,寻求开放与商业成功的平衡

Mistral公司在追求开放性和商业成功的平衡中迈出了新的一步。他们推出了一种新的许可协议,旨在在开放共享与商业利益之间找到一个平衡点。Mistral的新许可协议称为MNPL(Mistral Non-Production License),它允许项...

Read More
2024-05-22 talkingdev

Scale AI完成10亿美元F轮融资

Scale AI近日完成了由Accel领投的10亿美元F轮融资,之前的投资者也参与了本轮融资。作为现代人工智能数据浪潮的推动者,Scale AI所提供的服务需求十分巨大,公司在这一领域具有独特的优势。这笔巨额融资将进一步加强...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page