AI推理的相关内容 - 漫话开发者

2025-10-20 talkingdev

谷歌发布Coral NPU：开源边缘AI全栈平台，重塑终端智能生态

谷歌开发者博客最新推出的Coral NPU（神经网络处理器）标志着边缘AI领域的重要突破。该平台采用全栈式开源架构，专为低功耗、持续在线的边缘计算场景设计，有效解决了当前边缘设备面临的三大核心挑战：首先，通过统...

2025-10-17 talkingdev

Cloudflare近日正式发布Sandbox SDK，该技术允许开发者在全球边缘网络中安全运行沙盒化代码环境。作为边缘计算领域的重要突破，该SDK通过基于WebAssembly的隔离技术实现代码执行环境的安全隔离，有效防止潜在恶意代...

2025-10-14 talkingdev

业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相，该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡：吞吐量（每GPU每秒处理令牌数）...

2025-10-05 talkingdev

NeurIPS 2024系统推理研讨会最新收录的研究项目ProofOfThought提出了一种突破性的神经符号编程合成方法，通过结合大型语言模型的语义理解能力与Z3定理证明器的形式化验证机制，实现了兼具鲁棒性与可解释性的自动推理...

2025-10-01 talkingdev

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战，提出通过系统指令、工具配置、数据筛选和对话历史的精准协同，实现推理效果...

2025-09-25 talkingdev

WebAssembly运行时环境Wasmer近日宣布其边缘计算平台Wasmer Edge已实现对Python的完整支持。通过将Python解释器编译为WebAssembly模块，开发者可直接在边缘节点运行FastAPI、Django和LangChain等主流Python框架而无...

2025-09-10 talkingdev

Mozilla近日宣布对Firefox浏览器的AI运行时进行重大架构升级，将原本基于WebAssembly的“onnxruntime-web”替换为直接集成到浏览器底层的原生C++ ONNX Runtime。这一技术革新使Firefox的本地AI功能获得2-10倍的推理性...

2025-09-04 talkingdev

研究人员通过前沿AI技术实现了重大突破：利用自主生成的Metal GPU内核，将PyTorch在苹果设备上的推理速度平均提升1.87倍。这项研究测试了215个PyTorch模型，其中部分工作负载甚至达到基线性能的数百倍加速。该技术采...