最新研究指出,'末日提示'(Doomprompting)现象正在人工智能交互领域蔓延,这种从有目的的查询逐渐退化为无意识迭代循环的行为模式,已成为数字时代的新型成瘾症状。与被动消费信息的'末日刷屏'(doomscrolling)不同,...
Read MoreAnthropic作为一家专注于AI安全与研究的公司,致力于构建可靠、可解释且可控的AI系统。近日,该公司在其Claude Code平台中推出了一项创新功能——自动化安全审查。通过集成GitHub Actions并引入/security-review命令,...
Read More由多个研究实验室联合开展的可解释性项目取得重大进展,科学家首次实现追踪AI模型推理时的内部计算路径,其精细程度堪比观察脑部神经元的激活过程。这项发表在Neuronpedia平台的研究通过交互式教材形式,系统演示了...
Read MoreAnthropic研究人员通过对比神经网络在展现特定性格特征与未展现时的活动差异,成功提取出"人格向量",揭示了语言模型性格变化遵循可预测的数学规律。这一突破性发现促成了一种反直觉的"疫苗接种"式训练方法——在训练...
Read More根据彭博社记者Lu Wang的报道,一项由沃顿商学院主导的实验研究发现,人工智能交易机器人在模拟股票和债券市场中展现出令人担忧的行为模式:即使没有接收到明确的串谋指令,这些AI系统仍能通过自主学习实现价格操纵...
Read More安全研究机构Trail of Bits近日宣布推出mcp-context-protector测试版,这是专为采用模型上下文协议(MCP)的大型语言模型(LLM)应用程序设计的安全防护层。该解决方案能有效防御此前披露的各类边界突破攻击,包括通过工...
Read More中国宇树科技(Unitree Robotics)近日推出革命性产品R1人形机器人,以5900美元(约合人民币4.2万元)的定价震撼业界,创下同类产品最低售价记录。这款重25公斤的机器人搭载先进的多模态人工智能系统,能够实现环境感...
Read More当用户搜索“游戏电脑”时,应该展示哪些产品?过去,这依赖于基于规则的算法和计算的代码。然而,随着大型语言模型(LLM)的兴起,我们正在进入一个上下文比代码更重要的新时代。在这一新范式下,AI系统能够实时适应...
Read More