漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-31 talkingdev

开源|Zpdf:基于Zig语言的零拷贝PDF文本提取库,性能较MuPDF提升5倍

近日,一个名为Zpdf的开源项目在开发者社区引发关注。该项目是一个完全使用Zig语言编写的PDF文本提取库,其核心设计理念是“零拷贝”(Zero-copy),旨在实现极致性能。Zpdf通过内存映射(memory-mapped)技术直接操作...

Read More
2025-02-27 talkingdev

Allen AI推出OlmOCR:基于Qwen VL的PDF文本提取新突破

Allen AI近日宣布,其通过持续微调Qwen VL模型,成功训练出一款强大的PDF文本提取工具——OlmOCR。该模型基于超过20万份PDF文档进行训练,能够高效、精准地提取PDF中的文本内容。OlmOCR的推出标志着PDF文本提取技术的...

Read More