人工智能公司MiniMax在GitHub开源了其4560亿参数规模的推理模型M1,该模型采用创新的混合专家架构(MoE)并引入'闪电注意力'技术,实现百万token级别的超长上下文处理能力(相当于DeepSeek R1的8倍)。特别值得注意...
Read MoreTCANet作为一项突破性神经解码技术,通过多尺度卷积网络、时序压缩模块和堆叠自注意力机制的创新性结合,为运动想象脑电信号(MI-EEG)的解码提供了全新解决方案。该模型在GitHub开源后迅速引发脑机接口领域关注,其...
Read More谷歌近日宣布其人工智能模型Gemini 2.5 Pro和Flash版本已全面开放使用,同时推出预览版Flash-Lite。此次更新最引人注目的是引入了可控的“思考预算”机制,该技术通过动态分配计算资源,在保证推理精度的同时为开发者...
Read More近日,一个名为Models.dev的开源网站正式上线,该平台致力于构建一个开放的AI模型数据库,详细收录各类人工智能模型的规格参数、定价信息以及功能特性。这一举措为开发者、研究人员和企业提供了便捷的模型检索和比较...
Read MoreRetellio作为新一代销售智能分析平台,通过AI技术实时解析销售通话内容,自动提取关键客户洞察,并以播客、新闻简报或Slack消息等多样化形式输出。该平台采用先进的自然语言处理(NLP)和语音识别技术,能够精准捕捉...
Read MoreGitHub最新开源项目CoRT(Code Interpreter Reasoning)提出了一种创新的方法,通过提示工程(hint engineering)对大语言模型进行后训练(post-train),使其能够将复杂计算任务智能分配给外部代码解释器执行。这一...
Read MoreTreeRL是一种创新的语言模型训练方法,通过结合on-policy树搜索和中间监督机制,实现了无需单独奖励模型的LLM训练。这一技术突破来自最新arXiv论文,相比传统的ChainRL方法,TreeRL在数学推理和代码生成等复杂任务上...
Read More谷歌最新发布的技术论文系统阐述了AI代理在部署过程中面临的核心安全风险,并首次公开其自主研发的多维度防护框架。该研究聚焦模型欺骗攻击、数据泄露漏洞和自主行为失控三大挑战,提出包含动态权限控制、实时行为审...
Read More