规模的相关内容 - 漫话开发者

2025-07-10 talkingdev

[论文推荐]猫咪干扰大模型推理：无关信息触发推理模型错误率激增300%

最新研究发现，在数学问题中插入诸如'有趣的事实：猫一生大部分时间在睡觉'等无关短语，会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性，且蒸馏版模型表现...

2025-07-09 talkingdev

艾伦人工智能研究所（AI2）近日推出OLMo 2全开源语言模型家族，标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模，其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...

2025-07-09 talkingdev

OpenAI作为全球领先的人工智能研究机构，其商业化进程中的定价与计费策略备受业界关注。2021年，OpenAI从自建的手动计费系统转向由Metronome提供的基础设施支持，实现了对数百万用户和数千份企业合同的高效管理。这...

2025-07-08 talkingdev

开源项目Helicone近日发布了一款专为大型语言模型（LLM）设计的可观测性平台，该平台仅需一行代码即可实现对LLM的监控、评估和实验功能。作为Y Combinator W23批次的入选项目，Helicone致力于为开发者和企业提供高效...

2025-07-07 talkingdev

德国知名技术咨询公司TNG Technology Consulting GmbH近日发布了其最新研发的DeepSeek-TNG R1T2 Chimera模型。这一突破性进展在人工智能领域引起广泛关注，该模型不仅显著提升了处理速度达200%，同时大幅减少了输出t...

2025-07-06 talkingdev

人工通用智能（AGI）的崛起标志着经济秩序存在根本性断裂，消解了劳动与资本之间的历史界限。与过去的技术进步不同，AGI既是劳动者也是所有者，在创造经济价值的同时，将权力集中在控制其基础设施的人手中。如果不加...

2025-07-04 talkingdev

谷歌最新推出的Gemma 3N模型现可通过Dynamic GGUFs技术在本地环境中运行，技术社区已实现与llama.cpp、Ollama及Open WebUI生态的无缝集成。本文详解三种部署方案的技术要点：1）利用llama.cpp的量化推理优化实现低资...

2025-07-04 talkingdev

Osmosis-Apply-1.7B是基于Qwen3-1.7B模型通过强化学习微调而成的专用模型，在代码合并任务中表现出色，其奖励分数高达0.9893，甚至超越了OpenAI o3等更大规模的基础模型，同时显著降低了成本。该模型在CommitPackFT...