漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-12 talkingdev

开源|LangDiff:基于LLM的渐进式结构化数据流处理库

随着现代AI应用日益依赖大语言模型(LLM)生成结构化数据,如何高效流式传输这些输出成为技术挑战。全球AI平台推出的开源项目LangDiff提供了一种创新解决方案——这款Python库专为结构化LLM输出流式传输至前端而设计,...

Read More
2025-08-04 talkingdev

LangExtract:基于LLM的文本结构化信息提取库

Google近日在GitHub开源了LangExtract项目,这是一个基于大语言模型(LLM)的Python库,专门用于从非结构化文本中提取结构化信息。该库允许用户通过自定义指令,将杂乱的文本数据转化为可靠的格式化输出。其核心技术...

Read More
2025-07-16 talkingdev

OpenAI正开发ChatGPT智能体功能,支持生成PPT/Excel文件及自动化网站任务

据The Information记者Stephanie Palazzolo独家报道,OpenAI正在为ChatGPT开发新型智能体(agent)功能,旨在将其打造为白领工作的核心工具。这些功能将允许用户直接通过ChatGPT创建兼容Microsoft PowerPoint和Excel...

Read More
2025-07-10 talkingdev

WebMCP接入浏览器,改造AI与Web应用交互方式

WebMCP项目通过将Model Context Protocol(MCP)嵌入网页,实现了AI助手与Web应用的无缝交互。该技术突破性地绕过了传统API密钥管理和OAuth流程的复杂性,直接利用浏览器现有的认证与安全机制,在网页内部署MCP服务...

Read More
2025-06-17 talkingdev

NanonetsOCR:将文档转为结构化Markdown模型

Hugging Face平台上的Nanonets-OCR-s项目近日引发技术社区关注,该OCR模型能够将复杂文档(如PDF、扫描件)高效转换为结构化Markdown格式,解决了传统OCR输出非结构化数据的行业痛点。其技术亮点包括基于深度学习的...

Read More
2025-05-07 talkingdev

NVIDIA推出Radio文本与图像嵌入模型,性能媲美SigLIP

NVIDIA近期在Hugging Face Hub上发布了一系列文本与图像嵌入模型(Radio系列),其性能在多项基准测试中达到或超越当前热门的SigLIP模型。这些模型通过先进的神经网络架构优化了多模态数据的向量表示能力,可广泛应...

Read More
2025-05-06 talkingdev

VectorVFS:将文件系统转化为向量数据库的创新工具

近日,一个名为VectorVFS的开源项目在技术社区引发广泛关注。该项目通过创新的方式将传统文件系统映射为向量数据库,为数据检索和管理提供了全新思路。VectorVFS的核心技术在于利用向量嵌入技术对文件系统中的内容进...

Read More
2025-05-02 talkingdev

微软OmniParser v2.0:全新截图解析工具性能大提升

微软近日发布了其广受欢迎的截图解析工具OmniParser的重大版本更新——OmniParser v2.0。作为一款领先的视觉信息处理工具,新版本在Screenshot Pro基准测试中表现优异,展现了微软在计算机视觉和自然语言处理领域的技...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page