漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-04 talkingdev

浏览器内免费PDF编辑器BreezePDF发布,支持文本编辑、签名合并及加密

近日,一款名为BreezePDF的免费在线PDF编辑器引发技术社区广泛关注。该工具突破传统PDF软件限制,直接在浏览器中实现全功能操作:支持添加文本、图片、电子签名、表单字段,可删除/合并页面并通过密码保护文档安全。...

Read More
2025-04-23 talkingdev

[开源] Morphik:开源多模态RAG系统,本地运行可解析PDF图像内容

开发者Adi和Arnav在尝试让大语言模型(LLM)处理研究论文和说明书中的问题时,发现现有RAG(检索增强生成)系统无法有效解析PDF中的图像和图表内容,甚至GPT-4o和O3模型也表现不佳。为此,他们开发了开源项目Morphik...

Read More
2025-04-03 talkingdev

DeepMind推出Snowplow内核模糊测试工具,显著提升Linux内核漏洞检测效率

DeepMind最新研究推出的Snowplow是一种创新的内核模糊测试工具,其核心在于采用了基于学习的白盒变异器(learned white-box mutator),能够显著提升测试变异的效率。该工具在Linux内核模糊测试中表现出色,不仅大幅...

Read More
2025-04-01 talkingdev

KOReader:开源电子书阅读器的技术革新与应用前景

KOReader作为一款开源的电子书阅读器,凭借其高度可定制性和跨平台支持,正在技术社区中引发广泛关注。该阅读器支持多种电子书格式,包括PDF、EPUB、DJVU等,并提供了丰富的阅读功能,如文本重排、字体调整、夜间模...

Read More
2025-02-27 talkingdev

Allen AI推出OlmOCR:基于Qwen VL的PDF文本提取新突破

Allen AI近日宣布,其通过持续微调Qwen VL模型,成功训练出一款强大的PDF文本提取工具——OlmOCR。该模型基于超过20万份PDF文档进行训练,能够高效、精准地提取PDF中的文本内容。OlmOCR的推出标志着PDF文本提取技术的...

Read More
2025-02-16 talkingdev

Kreuzberg:现代异步Python库助力文档文本提取

近日,一款名为Kreuzberg的现代异步Python库在技术社区中引起了广泛关注。该库专注于文档文本提取,旨在为开发者提供高效、灵活的解决方案。Kreuzberg通过异步编程模型,显著提升了文本提取的速度和效率,尤其适用于...

Read More
2025-01-11 talkingdev

创意展示:PDF文件也能玩俄罗斯方块

近日,一位开发者在Hacker News上分享了一项创新项目——在PDF文件中运行俄罗斯方块游戏。这项技术展示了PDF格式的非传统应用,即利用PDF的交互式特性来实现游戏功能。用户可以在支持JavaScript的PDF阅读器中打开这个...

Read More
2024-12-14 talkingdev

MarkItDown:将常见办公文档转换为Markdown

MarkItDown是一个基于Python开发的工具,它具备将各种文件和办公文档转换成Markdown格式的能力。Markdown是一种轻量级的标记语言,它允许人们使用易读、易写的方式来编写文档,转换成的文档在多种平台上都能保持格式...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page