近日,DeepMind发布了一篇立场论文,探讨了如何衡量系统的“Agency”属性。论文指出,Agency的测量并非一个全局属性,而是依赖于特定的参考框架。这意味着,判断一个系统是否具有Agency,需要明确其所在的上下文和参考...
Read More近日,一项创新性研究提出了一种改进神经网络训练的新方法,该方法通过将回归任务重新构建为分类问题,利用学习到的目标编码器-解码器对来实现。与传统回归方法相比,这种新方法通过分布目标表示和平滑插值技术,显...
Read More近日,FedELC框架的推出为联邦学习领域带来了新的解决方案。FedELC是一个两阶段框架,旨在通过解决客户端数据集中的标签噪声问题来增强联邦学习的性能。在联邦学习中,数据分布在多个客户端,而标签噪声的存在会严重...
Read More近日,一款名为The Deck的开源跨平台多人卡牌游戏引擎正式发布。该引擎基于Flutter框架开发,旨在为开发者提供一个高效、灵活的工具,用于构建跨平台的多人卡牌游戏。The Deck不仅支持多种操作系统,包括iOS、Androi...
Read More近日,Hugging Face宣布尝试复现OpenAI的深度研究成果,特别是其基于agentic的web-search框架。该框架在GAIA基准测试中表现卓越,显著提升了性能。为了推动开源生态的发展,Hugging Face进行了一项长达24小时的实验...
Read MoreAcoupi是一款开源的Python框架,旨在简化基于AI的生物声学监测在低成本设备上的部署。该框架集成了录音、处理和实时消息传递功能,为研究人员和开发者提供了一个高效的工具,用于监测和分析自然环境中的声音数据。通...
Read More近日,一款名为SmolGPT的轻量级PyTorch实现框架正式发布,旨在帮助开发者从零开始训练小型LLM(Large Language Model)。该框架以其简洁的设计和高效的性能吸引了广泛关注。SmolGPT通过优化模型结构和训练流程,显著...
Read MoreQwen团队近日发布了其最新的1M上下文模型,展示了在训练过程中逐步扩展上下文能力的技术进展。该模型不仅性能强劲,还支持本地化运行,显著提升了处理长文本任务的效率。此外,Qwen团队还发布了基于vLLM的推理框架,...
Read More