苹果机器学习研究团队在GitHub上开源了蛋白质结构预测工具SimpleFold,其技术细节同步发布于预印本平台arXiv。该项目通过优化深度学习架构和训练策略,显著降低了蛋白质三维结构预测的计算复杂度。与传统方案相比,S...
Read MoreOpenCUA项目近日发布了一套全面的开源工具包,旨在构建高效的计算机使用智能体。该工具包包含数据收集工具、训练流程,以及覆盖三大操作系统和200余款应用的2.2万条人类操作轨迹数据。其核心创新在于"反射式长链思维...
Read More近期,一项关于大语言模型(LLM)上下文学习(ICL)能力的研究取得了重要突破。研究人员提出了一种理论框架,解释了非线性残差变换器如何通过向量算术执行事实召回ICL任务。该研究基于分层概念建模,证明了通过梯度...
Read More随着深度神经网络(DNNs)在边缘设备上的应用日益广泛,网络压缩技术的重要性愈发凸显。针对现有方法在边缘设备部署上的挑战,研究者提出了一种创新的分数阶高斯滤波与剪枝(FGFP)框架。该框架将分数阶微分计算与高...
Read More近期,佛教学者对ChatGPT o3生成的一篇AI“佛经”进行了专业分析,发现其通过悖论解构等手法,呈现出复杂的哲学概念与意象,成功唤起了佛教核心教义如“空性”的思考。研究表明,尽管大语言模型(LLMs)能够复述佛法教义...
Read MoreVoxtral团队最新发布了Voxtral Mini和Voxtral Small两款多模态音频聊天模型,在语音理解和文本处理方面均达到业界领先水平。这两款模型能够同时处理语音音频和文本文档,在多项音频基准测试中取得了最先进的性能表现...
Read More一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...
Read More一项名为'基于能量的Transformer'(Energy-Based Transformers)的新型架构在机器学习领域取得突破性进展。该技术摒弃了传统的直接预测方式,转而采用学习验证函数来评估输入与候选输出之间的兼容性得分。这种创新架...
Read More