一项名为cchistory的逆向工程项目成功追踪了Anthropic公司旗下Claude Code人工智能助手67个版本的系统提示词演变过程。该项目通过突破反调试保护措施,揭示了AI公司如何通过精细调整系统指令(而非单纯模型升级)来...
Read More近日,一篇关于PDF文件解析技术的文章在技术社区引发了广泛讨论。文章深入探讨了PDF文件中交叉引用表(XREF)的解析方法,这是PDF文档结构中的关键组成部分。XREF表包含了PDF文件中所有对象的偏移量信息,正确解析XR...
Read More近期,佛教学者对ChatGPT o3生成的一篇AI“佛经”进行了专业分析,发现其通过悖论解构等手法,呈现出复杂的哲学概念与意象,成功唤起了佛教核心教义如“空性”的思考。研究表明,尽管大语言模型(LLMs)能够复述佛法教义...
Read More月之暗面(MoonshotAI)团队最新发布的Kimi K2技术报告揭示了其大型语言模型系列的重大技术突破。该团队创新性地开发出MuonClip技术,通过将token高效的Muon优化器与新型QK-Clip技术相结合,成功解决了万亿参数模型训...
Read More从复杂的PDF中提取信息一直是个棘手的问题。行业在OCR(光学字符识别)、布局检测和解析流程上投入了大量精力和资金,却仍可能丢失最关键的信息。如今,视觉语言模型(Vision Language Models)已经足够强大,能够直...
Read More一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...
Read More一项名为'基于能量的Transformer'(Energy-Based Transformers)的新型架构在机器学习领域取得突破性进展。该技术摒弃了传统的直接预测方式,转而采用学习验证函数来评估输入与候选输出之间的兼容性得分。这种创新架...
Read More最新研究发现,在数学问题中插入诸如'有趣的事实:猫一生大部分时间在睡觉'等无关短语,会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性,且蒸馏版模型表现...
Read More