AI系统架构的相关内容 - 漫话开发者

2026-03-16 talkingdev

突破性研究：Transformer能否成为通用计算机？Percepta展示在模型内部执行C程序

人工智能研究机构Percepta近期发布了一项前沿研究成果，探讨了大型语言模型（LLMs）作为通用计算设备的可能性。该研究成功在Transformer架构内部构建了一个“计算机”，能够高效执行任意的C语言程序，并运行数百万个计...

2025-08-31 talkingdev

ACM SIGPLAN博客最新发布的观点文章指出，当前AI模型运行环境存在严重碎片化问题，研究者提出应为AI模型构建类似Java虚拟机的标准化运行时环境。该方案能解决模型跨平台部署、资源管理和版本兼容等核心痛点，通过抽...

2025-06-27 talkingdev

Meta旗下FAIR研究团队在arXiv最新论文中提出重大架构革新，通过名为Dynamic Tanh（DyT）的逐元素操作替代传统归一化层，使Transformer模型在保持性能的同时摆脱了对归一化层的依赖。这种S型曲线模拟技术能够自然复现...

2025-06-17 talkingdev

GitHub最新开源项目CoRT（Code Interpreter Reasoning）提出了一种创新的方法，通过提示工程（hint engineering）对大语言模型进行后训练（post-train），使其能够将复杂计算任务智能分配给外部代码解释器执行。这一...

2025-06-09 talkingdev

苹果公司研究团队通过定制化谜题环境对大型推理模型(LRMs)进行了系统性评估，揭示了人工智能推理能力的重要局限性。研究发现，随着任务复杂度提升，LRMs会经历推理效能先上升后急剧下降的拐点现象，最终在高度复杂任...