Anthropic联合英国AI安全研究所与艾伦·图灵研究所的最新研究表明,大语言模型面临严重的数据投毒威胁。实验发现,仅需在训练数据中插入250份被篡改的文档(仅占训练总量的0.00016%),就能在参数规模从6亿到130亿不...
Read More在大型语言模型的技术架构中,采样与结构化输出是决定模型生成质量与可控性的两大核心技术。采样指模型根据概率分布从词汇表中选择下一个标记的过程,直接影响了文本生成的多样性和创造性。而结构化输出技术则赋予模...
Read MoreOpenAI首席执行官Sam Altman近日宣布,公司将恢复ChatGPT中的GPT-4o模型,并提高免费和Plus用户的推理模型使用限制。这一举措被视为对用户反馈的积极回应,尤其是在推理模型使用量激增的背景下。GPT-4o作为OpenAI的...
Read MoreOpenAI首席执行官Sam Altman近日透露,ChatGPT每周服务用户量已达7亿人次,而普通开发者甚至难以在本地单机运行一个GPT-4级别的模型。这引发了技术社区对超大规模AI服务背后工程架构的热议。专家分析指出,支撑这一...
Read More谷歌Android生态系统总裁Sameer Samat近日深入探讨了Android平台的最新进展,包括即将发布的Android 16系统及其与Gemini AI的深度整合。谷歌正致力于提升Android系统的可定制性和跨设备兼容性,例如即将上市的三星Ga...
Read MoreOpenAI模型行为与政策负责人近日阐述了公司对用户与ChatGPT建立情感连接现象的管理策略。尽管从科学角度尚无法证实AI是否具备意识,OpenAI明确表示要避免在缺乏证据的情况下让用户误认为AI模型具有感知能力。该公司...
Read MoreOpenAI首席执行官Sam Altman近期发表题为《温和奇点》的专题文章,系统阐述了人类即将构建数字超级智能(Digital Superintelligence)的技术前景与社会影响。该文通过逐段解构发现,Altman试图传递一种审慎乐观的技...
Read More近日,一项名为PTSD(Progressive Tempering Sampler with Diffusion)的新型采样技术在预印本平台arXiv上发布,该技术通过序列化温度调节训练扩散模型,显著提升了从未归一化概率密度中采样的效率。传统方法在复杂...
Read More