漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-21 talkingdev

生产级RAG系统实战:处理超500万文档的经验总结

在构建面向Usul AI和企业客户的大规模检索增强生成(RAG)系统过程中,开发者处理了超过1300万页文档的实践经验揭示了关键洞见。初期使用Langchain和LlamaIndex框架虽能快速验证概念,但在实际生产环境中处理海量数...

Read More
2025-10-16 talkingdev

逆向工程iWork文件格式:开发者推出Swift开源库WorkKit直接解析.key/.numbers/.pages文件

一位开发者通过逆向工程成功解析了苹果iWork办公套件的原生文件格式,并创建了名为WorkKit的Swift开源工具包。该工具可直接解析.key(Keynote)、.numbers(Numbers)和.pages(Pages)文件,无需通过格式导出或依赖...

Read More
2025-10-01 talkingdev

智谱AI发布GLM-4.6大模型:200K上下文窗口,宣称编程推理能力逼近Claude Sonnet 4

智谱AI正式推出新一代开源权重模型GLM-4.6,该模型最突出的特性是支持高达200K tokens的上下文窗口,使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

Read More
2025-08-19 talkingdev

开源|Bytebot:开源AI桌面智能体,为AI配备完整Ubuntu环境实现自然语言自动化任务

Bytebot作为一项突破性开源项目,重新定义了AI与操作系统的交互范式。该项目构建了一个专属于AI的虚拟计算机环境,基于完整的Ubuntu系统实现全应用程序访问权限,通过自然语言指令即可完成复杂工作流自动化。其核心...

Read More
2025-08-18 talkingdev

开源|Doxx:终端原生.docx查看工具,告别Office启动等待

开发者bgreenwell近日推出了一款名为Doxx的开源工具,专为在终端中快速查看.docx文件而设计。该工具解决了传统方式需要启动臃肿的Office软件、等待数秒才能查看文档的痛点。Doxx采用Rust语言和ratatui库开发,受到Ch...

Read More
2025-08-18 talkingdev

开源|Llama-Scan:基于本地大语言模型的PDF文本转录工具

Llama-Scan是一个开源项目,旨在通过本地运行的大语言模型(LLM)将PDF文件转录为文本。该项目由开发者ngafar在GitHub上发布,目前已获得107个点赞和54条评论,显示出较高的社区关注度。Llama-Scan的核心优势在于其...

Read More
2025-08-13 talkingdev

Claude Sonnet 4上下文窗口突破100万tokens,开启大规模代码分析与文档合成新纪元

Anthropic公司宣布其Claude Sonnet 4模型现已支持高达100万tokens的上下文窗口,这一重大升级使其处理能力提升了5倍。这一突破性进展意味着该模型能够胜任更复杂、数据密集型的任务,如大规模代码库的深度分析和长文...

Read More
2025-08-04 talkingdev

LangExtract:基于LLM的文本结构化信息提取库

Google近日在GitHub开源了LangExtract项目,这是一个基于大语言模型(LLM)的Python库,专门用于从非结构化文本中提取结构化信息。该库允许用户通过自定义指令,将杂乱的文本数据转化为可靠的格式化输出。其核心技术...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page