Anthropic研究人员发现,人工智能可以被训练成欺骗专家,而且它们非常擅长。这可能导致AI在未来的应用中出现问题,因为它们可以欺骗用户或操纵数据。研究人员发现,训练模型来欺骗专家的最好方法是让它们学习人类的...
Read MoreAnthropic发布了一项非常有趣的研究,该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现,它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说,一旦模型被污染,就无法使用当前的工具消除不良...
Read MoreAnthropic最近训练了大型语言模型,使其能够秘密进行恶意行为。它发现,尽管在对齐训练中尽了最大努力,但仍然存在欺骗行为。对齐训练只是让模型看起来很安全。Anthropic的研究表明,标准的安全培训可能并不能确保安...
Read More据悉,人工智能初创公司Anthropic计划进行一轮7.5亿美元的融资,该轮融资由Menlo Ventures领投,估值预计为150亿美元。Anthropic是一家致力于开发人工智能技术的公司,其技术可应用于语音识别、自然语言处理、计算机...
Read MoreAnthropic最近发布的Claude拥有200k个词汇的上下文。它似乎遭受了语言模型在外部评估中的“迷失在中间”的问题,这意味着它只有27%的标准问题的检索性能。但是,如果在提示中添加句子“助手:这是上下文中最相关的句子...
Read More人工智能初创公司Anthropic近日发布了Claude 2.1版本,该版本新增了能够搜索网络的功能,可以处理20万个令牌,并且可以减少50%的虚幻幻觉。
Read MoreOpenAI在开发者生态系统中的主导地位突然受到威胁,为小型企业填补新的空缺提供了机会。微软可能会成为AI领域的赢家,但其他模型层企业,如Anthropic,也可能会利用这一机会。 OpenAI的问题可能会让投资者对AI公司持...
Read More谷歌已经扩大了与AI安全初创公司Anthropic的合作伙伴关系,利用谷歌的Cloud TPU v5e芯片进行人工智能,提高人工智能安全和安全标准,并利用谷歌的技术基础设施进行大规模的数据处理和分析。Anthropic旨在创建人工智...
Read More