漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-05 talkingdev

逆向工程揭秘:cchistory项目追踪Claude Code系统提示词演变历程

一项名为cchistory的逆向工程项目成功追踪了Anthropic公司旗下Claude Code人工智能助手67个版本的系统提示词演变过程。该项目通过突破反调试保护措施,揭示了AI公司如何通过精细调整系统指令(而非单纯模型升级)来...

Read More
2025-08-04 talkingdev

PDF解析技术解析:深入探讨交叉引用表(XREF)的解析方法

近日,一篇关于PDF文件解析技术的文章在技术社区引发了广泛讨论。文章深入探讨了PDF文件中交叉引用表(XREF)的解析方法,这是PDF文档结构中的关键组成部分。XREF表包含了PDF文件中所有对象的偏移量信息,正确解析XR...

Read More
2025-08-01 talkingdev

[论文推荐]《异经》:AI生成的“佛经”能否承载意义与价值?学者深度解析

近期,佛教学者对ChatGPT o3生成的一篇AI“佛经”进行了专业分析,发现其通过悖论解构等手法,呈现出复杂的哲学概念与意象,成功唤起了佛教核心教义如“空性”的思考。研究表明,尽管大语言模型(LLMs)能够复述佛法教义...

Read More
2025-07-22 talkingdev

[开源]MoonshotAI发布Kimi K2技术报告:突破万亿参数模型训练瓶颈

月之暗面(MoonshotAI)团队最新发布的Kimi K2技术报告揭示了其大型语言模型系列的重大技术突破。该团队创新性地开发出MuonClip技术,通过将token高效的Muon优化器与新型QK-Clip技术相结合,成功解决了万亿参数模型训...

Read More
2025-07-22 talkingdev

无需解析文档:直接使用图像进行RAG检索

从复杂的PDF中提取信息一直是个棘手的问题。行业在OCR(光学字符识别)、布局检测和解析流程上投入了大量精力和资金,却仍可能丢失最关键的信息。如今,视觉语言模型(Vision Language Models)已经足够强大,能够直...

Read More
2025-07-18 talkingdev

[论文推荐] 突破长文本限制:新型“Power”注意力机制实现高效训练

一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...

Read More
2025-07-15 talkingdev

[论文推荐]基于能量的Transformer模型:可扩展的学习与思考者

一项名为'基于能量的Transformer'(Energy-Based Transformers)的新型架构在机器学习领域取得突破性进展。该技术摒弃了传统的直接预测方式,转而采用学习验证函数来评估输入与候选输出之间的兼容性得分。这种创新架...

Read More
2025-07-10 talkingdev

[论文推荐]猫咪干扰大模型推理:无关信息触发推理模型错误率激增300%

最新研究发现,在数学问题中插入诸如'有趣的事实:猫一生大部分时间在睡觉'等无关短语,会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性,且蒸馏版模型表现...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page