OCR的相关内容 - 漫话开发者

2025-10-21 talkingdev

开源|DeepSeek-OCR：突破长上下文压缩瓶颈，日生成20万页训练数据

DeepSeek-AI团队最新开源的DeepSeek-OCR项目在长上下文压缩技术领域实现重要突破。该项目通过创新的光学二维映射技术，探索将长文本上下文进行高效压缩的可行性。系统由DeepEncoder核心引擎和DeepSeek3B-Moe-A570M解...

2025-08-16 talkingdev

阿姆斯特丹Ritman图书馆与《达芬奇密码》作者丹·布朗合作，成功将2178本珍贵的神秘学书籍数字化并免费向公众开放。这一项目不仅保护了这些易损的历史文献，还通过现代技术手段让全球研究者能够便捷地访问这些稀有资...

2025-07-22 talkingdev

Morphik.ai公司创新性地提出了一种基于视觉的文档检索方法，该方法摒弃了传统的OCR（光学字符识别）和解析技术，转而采用文档页面的图像作为处理对象。通过将文档图像分割成小块，并利用视觉Transformer和语言模型，...

2025-07-22 talkingdev

从复杂的PDF中提取信息一直是个棘手的问题。行业在OCR（光学字符识别）、布局检测和解析流程上投入了大量精力和资金，却仍可能丢失最关键的信息。如今，视觉语言模型（Vision Language Models）已经足够强大，能够直...

2025-06-17 talkingdev

Nanonets-OCR-s是一款前沿的图像转Markdown OCR模型，其能力远超传统文本提取技术。该模型通过智能内容识别和语义标记，能够将文档转化为结构化的Markdown格式。它不仅理解文档结构和内容上下文，还能输出智能格式化...

2025-06-17 talkingdev

Hugging Face平台上的Nanonets-OCR-s项目近日引发技术社区关注，该OCR模型能够将复杂文档（如PDF、扫描件）高效转换为结构化Markdown格式，解决了传统OCR输出非结构化数据的行业痛点。其技术亮点包括基于深度学习的...

2025-05-27 talkingdev

Mistral AI最新推出的企业级文档AI解决方案，通过整合先进的OCR（光学字符识别）技术，为组织提供高效的文档管理工具。该系统能够从多种文档类型中精准提取并分类数据，不仅大幅提升数据处理效率，还帮助企业更好地...

2025-05-04 talkingdev

近日，一款名为BreezePDF的免费在线PDF编辑器引发技术社区广泛关注。该工具突破传统PDF软件限制，直接在浏览器中实现全功能操作：支持添加文本、图片、电子签名、表单字段，可删除/合并页面并通过密码保护文档安全。...