基准测试的相关内容 - 漫话开发者

2025-08-28 talkingdev

开源|JS压缩工具性能基准测试：SWC拔得头筹，oxc-minify速度称王

一项针对主流JavaScript代码压缩工具的深度基准测试在GitHub上发布，该研究对babel-minify、esbuild、terser、uglify-js、swc、Google Closure Compiler等8款工具进行了系统评估。测试采用真实世界库作为样本，创新...

2025-08-27 talkingdev

近日，一款名为Porffor的新型JavaScript引擎在云计算领域引发关注。该引擎采用前瞻性编译技术，可将JS代码预先编译为WebAssembly及原生二进制文件，生成比Node.js等传统运行时更小、更快的可执行文件。在AWS Lambda...

2025-08-22 talkingdev

卡内基梅隆大学研究人员推出PACT（Pairwise Auction Conversation Testbed）对话议价基准测试平台，这是首个专门针对语言模型讨价还价能力构建的大规模评估体系。该平台包含超过5,000场对话博弈实验，每场包含20轮完...

2025-08-21 talkingdev

开发者Ryan Skinner近日发布全新全栈React框架Rari，其基于自定义Rust运行时与V8引擎构建，在性能基准测试中展现出惊人表现——比Next.js快4倍且吞吐量提升400%。该框架采用三层架构设计：Rust核心运行时负责React服务...

2025-08-20 talkingdev

技术社区近期热议的新型操作系统AnduinOS（官网：anduinos.com）在Hacker News平台引发广泛关注，获得105点赞和126条深度讨论。该项目虽未公开具体技术细节，但从社区反馈可见其可能涉及操作系统架构创新或分布式计...

2025-08-17 talkingdev

近日，Artificial Analysis发布了一项针对OpenAI开源大语言模型gpt-oss-120b的性能基准测试报告。该测试聚焦于同一模型在不同托管服务提供商环境中的表现差异，结果显示各平台间的性能存在明显波动。作为当前参数规...

2025-08-13 talkingdev

艾伦人工智能研究所（AI2）近日开源了MolmoAct模型，这是首个基于Molmo框架构建的、专注于三维空间推理的动作理解系统。该模型通过创新的三维空间表征学习方法，实现了对复杂指令的精准环境交互能力，在SpatialQA等...

2025-07-30 talkingdev

Daily Bench是一个开源的仪表盘项目，专注于监控Anthropic、Google和OpenAI等主流AI提供商的模型性能表现。该项目旨在检测模型在官方发布版本之间可能出现的质量退化问题，这些问题通常由推理过程变更、知识蒸馏或量...