最新研究发现,在数学问题中插入诸如'有趣的事实:猫一生大部分时间在睡觉'等无关短语,会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性,且蒸馏版模型表现...
Read More艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...
Read MoreOpenAI作为全球领先的人工智能研究机构,其商业化进程中的定价与计费策略备受业界关注。2021年,OpenAI从自建的手动计费系统转向由Metronome提供的基础设施支持,实现了对数百万用户和数千份企业合同的高效管理。这...
Read More开源项目Helicone近日发布了一款专为大型语言模型(LLM)设计的可观测性平台,该平台仅需一行代码即可实现对LLM的监控、评估和实验功能。作为Y Combinator W23批次的入选项目,Helicone致力于为开发者和企业提供高效...
Read More德国知名技术咨询公司TNG Technology Consulting GmbH近日发布了其最新研发的DeepSeek-TNG R1T2 Chimera模型。这一突破性进展在人工智能领域引起广泛关注,该模型不仅显著提升了处理速度达200%,同时大幅减少了输出t...
Read More人工通用智能(AGI)的崛起标志着经济秩序存在根本性断裂,消解了劳动与资本之间的历史界限。与过去的技术进步不同,AGI既是劳动者也是所有者,在创造经济价值的同时,将权力集中在控制其基础设施的人手中。如果不加...
Read More谷歌最新推出的Gemma 3N模型现可通过Dynamic GGUFs技术在本地环境中运行,技术社区已实现与llama.cpp、Ollama及Open WebUI生态的无缝集成。本文详解三种部署方案的技术要点:1)利用llama.cpp的量化推理优化实现低资...
Read MoreOsmosis-Apply-1.7B是基于Qwen3-1.7B模型通过强化学习微调而成的专用模型,在代码合并任务中表现出色,其奖励分数高达0.9893,甚至超越了OpenAI o3等更大规模的基础模型,同时显著降低了成本。该模型在CommitPackFT...
Read More