随着人工智能向智能体(Agent)方向演进,传统的大模型推理基准测试正面临根本性变革。智能体工作负载不再是简单的单轮问答,而是包含多轮交互、工具调用等复杂场景。这种变化给推理引擎带来了前所未有的压力,尤其...
Read More近日,GitHub上开源了一个名为GoModel的高性能AI网关项目,该项目使用Go语言编写,旨在为开发者提供一个统一的、兼容OpenAI API标准的接口,以无缝对接包括OpenAI、Anthropic(Claude)、Google Gemini、Groq、xAI(...
Read More全球顶级创业孵化器Y Combinator(YC)近日从其官网的公司列表中移除了AI基础设施初创公司Delve,这一举动在科技创投社区Hacker News上引发了广泛关注与讨论,相关帖子获得了182个支持点和93条评论。尽管YC官方及Del...
Read More在人工智能领域,算力已成为决定模型性能与创新速度的核心战略资源。近期,Anthropic凭借其Opus 4.5模型的重大突破,将自身计算容量提升了一倍以上,从而使其总计算能力接近甚至在某些方面(如新模型运行的有效算力...
Read More由英伟达支持的美国人工智能初创公司Reflection正引领一项重要行动,旨在构建可自由获取的美国本土AI系统。作为少数几家与英伟达关联、致力于构建开源AI模型网络的初创企业之一,Reflection目前正进行融资谈判,计划...
Read More近日,一个名为Tinybox的离线AI设备项目在技术社区引发了广泛关注。该项目旨在打造一款能够本地离线运行高达1200亿参数大型语言模型的紧凑型硬件设备。这一构想直击当前AI应用的核心痛点:数据隐私、网络依赖和高昂...
Read MoreNVIDIA近日在GitHub上开源了NemoClaw项目,这是一个旨在简化和保障OpenClaw“始终在线”助手安全运行的软件栈。其核心创新在于通过安装NVIDIA OpenShell运行时,为OpenClaw创建一个严格隔离的沙盒环境。在该环境中,所...
Read More微软近日在GitHub上开源了Agent Package Manager(APM),这是一个专为AI智能体设计的开源、社区驱动的依赖管理器。该工具旨在解决AI智能体开发中环境配置复杂、依赖项管理繁琐的痛点。开发者只需在一个YML文件中声...
Read More