大语言模型(LLM)通过Tokenization技术将文本分解为更小的单元,再转换为数值表示进行处理。这一过程涉及BPE(字节对编码)、WordPiece和SentencePiece等主流算法,直接影响模型的计算成本、上下文理解能力和多语言处理...
Read More据彭博社报道,以Anthropic和OpenAI为代表的人工智能初创公司正在加速从华尔街金融机构招募量化研究员,提供极具竞争力的薪酬和福利。在曼哈顿下东区的一个屋顶酒吧,约150名量化研究员与Anthropic的员工进行了会面...
Read MoreOpenAI正式推出其最新一代人工智能模型GPT-5,该模型现已在ChatGPT中向所有用户开放。GPT-5在数学、科学、金融、法律等多个领域展现出更卓越的智能水平,能够提供更有用且准确的回答,并具备更深层次的思考能力。此...
Read MoreAnthropic研究人员通过对比神经网络在展现特定性格特征与未展现时的活动差异,成功提取出"人格向量",揭示了语言模型性格变化遵循可预测的数学规律。这一突破性发现促成了一种反直觉的"疫苗接种"式训练方法——在训练...
Read More阿里巴巴最新开源的Qwen3-235B思维模型在技术领域取得重大突破,该模型在AIME25数学竞赛中达到92.3%的准确率,与OpenAI的O4-mini性能相当,并在编码基准测试中以74.1%的LiveCodeBench得分实现超越。这一2350亿参数的...
Read More继OpenAI在周六宣布其模型获得金牌后,Google也宣布其Gemini Deep Think模型在国际数学奥林匹克竞赛(IMO)中解决了六道题目中的五道,并获得了赛事官方认证的金牌标准。这一突破标志着Google在人工智能领域的重大进...
Read More近期,一篇关于强化学习(RL)如何扩展至惊人10^26 FLOPs(每秒浮点运算次数)的探讨引起了业界广泛关注。文章指出,强化学习被视为构建前沿AI模型,尤其是大型语言模型(LLMs)的下一个核心训练技术。传统观点认为...
Read More最新研究发现,在数学问题中插入诸如'有趣的事实:猫一生大部分时间在睡觉'等无关短语,会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性,且蒸馏版模型表现...
Read More