PDF的相关内容 - 漫话开发者

2026-03-14 talkingdev

Claude重磅更新：Opus 4.6与Sonnet 4.6全面开放100万上下文窗口，取消长文本溢价

人工智能公司Anthropic正式宣布，其旗舰模型Claude Opus 4.6和Sonnet 4.6现已全面开放100万上下文窗口的常规使用。此次更新的核心在于，标准定价将适用于完整的100万token上下文窗口，彻底取消了此前针对长上下文的...

2026-03-11 talkingdev

近日，GitHub上开源项目RCLI引发开发者社区关注。该项目是一款专为搭载Apple Silicon芯片的macOS设备设计的全本地化语音AI助手。其核心价值在于构建了一个完整的端侧AI处理流水线，集成了语音识别（Speech-to-Text）...

2026-03-11 talkingdev

谷歌近日正式推出了其新一代多模态嵌入模型Gemini Embedding 2，标志着人工智能在跨模态语义理解领域迈出了关键一步。该模型通过Gemini API和Vertex AI平台提供服务，其核心突破在于首次将文本、图像、视频、音频及...

2026-01-31 talkingdev

近日，国内人工智能公司月之暗面（Moonshot AI）在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开，迅速吸引了全球开发者与AI研究者的高度关注，在知名技术社区Hacker News上获得...

2026-01-22 talkingdev

近日，由新闻自由基金会（Freedom of the Press Foundation）维护的开源项目Dangerzone在技术社区引发关注。该项目旨在解决一个长期困扰信息安全领域的痛点：如何安全地打开可能嵌入恶意代码的PDF、Office文档或图像...

2026-01-08 talkingdev

在开源人工智能社区中，PDF文档长期以来被视为一座未被充分挖掘的高质量数据金矿。近日，Hugging Face团队正式发布了其开创性的预训练数据集项目——FinePDFs，成功从海量PDF文档中提取并构建了一个规模超过3万亿令牌...

2025-12-31 talkingdev

近日，一个名为Zpdf的开源项目在开发者社区引发关注。该项目是一个完全使用Zig语言编写的PDF文本提取库，其核心设计理念是“零拷贝”（Zero-copy），旨在实现极致性能。Zpdf通过内存映射（memory-mapped）技术直接操作...

2025-12-24 talkingdev

近日，一款名为X-ray的Python开源工具在技术社区引发关注。该项目由freelawproject开发，核心功能是自动检测PDF文档中是否存在“无效涂黑”问题。所谓“无效涂黑”，是指文档编辑者试图通过黑色矩形块遮盖敏感信息，但因...