谷歌开发者博客最新推出的Coral NPU(神经网络处理器)标志着边缘AI领域的重要突破。该平台采用全栈式开源架构,专为低功耗、持续在线的边缘计算场景设计,有效解决了当前边缘设备面临的三大核心挑战:首先,通过统...
Read MoreCloudflare近日正式发布Sandbox SDK,该技术允许开发者在全球边缘网络中安全运行沙盒化代码环境。作为边缘计算领域的重要突破,该SDK通过基于WebAssembly的隔离技术实现代码执行环境的安全隔离,有效防止潜在恶意代...
Read More业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相,该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡:吞吐量(每GPU每秒处理令牌数)...
Read MoreNeurIPS 2024系统推理研讨会最新收录的研究项目ProofOfThought提出了一种突破性的神经符号编程合成方法,通过结合大型语言模型的语义理解能力与Z3定理证明器的形式化验证机制,实现了兼具鲁棒性与可解释性的自动推理...
Read More人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战,提出通过系统指令、工具配置、数据筛选和对话历史的精准协同,实现推理效果...
Read MoreWebAssembly运行时环境Wasmer近日宣布其边缘计算平台Wasmer Edge已实现对Python的完整支持。通过将Python解释器编译为WebAssembly模块,开发者可直接在边缘节点运行FastAPI、Django和LangChain等主流Python框架而无...
Read MoreMozilla近日宣布对Firefox浏览器的AI运行时进行重大架构升级,将原本基于WebAssembly的“onnxruntime-web”替换为直接集成到浏览器底层的原生C++ ONNX Runtime。这一技术革新使Firefox的本地AI功能获得2-10倍的推理性...
Read More研究人员通过前沿AI技术实现了重大突破:利用自主生成的Metal GPU内核,将PyTorch在苹果设备上的推理速度平均提升1.87倍。这项研究测试了215个PyTorch模型,其中部分工作负载甚至达到基线性能的数百倍加速。该技术采...
Read More