近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...
Read MoreOpenAI近日公布了其GPT系列模型的未来发展路线图,计划在推出GPT-5之前,先发布GPT-4.5作为最后一个非链式思维(non-chain-of-thought)模型。GPT-5将实现o-series与GPT-series模型的统一,标志着OpenAI在大型语言模...
Read More苹果公司目前正处于人形机器人和非人形机器人的早期概念验证阶段。据内部消息透露,苹果正在积极研究相关技术,但大规模生产预计不会早于2028年。这一举措标志着苹果在人工智能和机器人领域的进一步扩展,尽管目前仍...
Read More谷歌DeepMind最近发布了一段视频,展示了微型人形机器人进行一对一足球比赛的能力。这些机器人不仅能够理解足球比赛的规则,还能预测球的运动方向以及何时拦截对手的射门。这段15秒的视频充分展示了DeepMind在机器人...
Read More近日,DeepMind发布了一篇立场论文,探讨了如何衡量系统的“Agency”属性。论文指出,Agency的测量并非一个全局属性,而是依赖于特定的参考框架。这意味着,判断一个系统是否具有Agency,需要明确其所在的上下文和参考...
Read More随着WebAssembly(WASM)技术的快速发展,越来越多的开发者开始关注其在应用部署领域的潜力。WASM最初设计用于在浏览器中运行高性能代码,但其轻量级、跨平台和安全性等特性使其逐渐成为容器技术的潜在替代者。与传...
Read More近日,Mistral发布了一款名为Mistral le Chat的全新聊天助手,其处理速度高达每秒1000字,成为目前市场上最快的聊天助手之一。该助手基于Mistral强大的先进编码模型,结合直观的用户界面,能够高效协助用户完成多种...
Read More近日,FedELC框架的推出为联邦学习领域带来了新的解决方案。FedELC是一个两阶段框架,旨在通过解决客户端数据集中的标签噪声问题来增强联邦学习的性能。在联邦学习中,数据分布在多个客户端,而标签噪声的存在会严重...
Read More