漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-29 talkingdev

ClickHouse发布2800万条Hacker News评论向量搜索数据集

数据分析平台ClickHouse近日正式发布Hacker News向量搜索数据集,该数据集包含超过2800万条Hacker News社区评论及其对应的向量嵌入表示。这一数据集将成为开发者和研究人员构建语义搜索系统、推荐算法和自然语言处理...

Read More
2025-11-07 talkingdev

谷歌Gemini API推出文件搜索工具:内置RAG系统,简化检索任务

谷歌近日在Gemini API中正式推出文件搜索工具(File Search),这是一个完全托管的检索增强生成(RAG)系统,直接集成于API架构中。该系统通过向量搜索技术实现高效语义匹配,并自动生成引用来源,支持包括PDF、Word...

Read More
2025-10-02 talkingdev

Slack向AI开放工作对话权限,实时API重塑企业数据交互模式

Slack正通过创新技术架构彻底改变AI代理访问企业数据的方式。该平台最新推出的实时搜索API和模型上下文协议服务器,允许第三方开发者在获得权限的前提下,直接接入Slack渠道中的对话流、消息记录及文件资源。这一突...

Read More
2025-09-26 talkingdev

Perplexity发布Search API,开放其百亿级网页检索基础设施

人工智能公司Perplexity正式推出全新Search API服务,该API允许开发者直接调用其公共问答引擎背后的大规模基础设施,实现对数千亿网页的高质量信息检索。这一技术突破意味着第三方开发者能够利用Perplexity经过优化...

Read More
2025-09-24 talkingdev

大语言模型核心解码:采样与结构化输出如何协同塑造下一代AI

在大型语言模型的技术架构中,采样与结构化输出是决定模型生成质量与可控性的两大核心技术。采样指模型根据概率分布从词汇表中选择下一个标记的过程,直接影响了文本生成的多样性和创造性。而结构化输出技术则赋予模...

Read More
2025-08-15 talkingdev

开源|YAMS:专为LLM设计的高效持久内存存储系统

YAMS(Yet Another Memory System)是一款专为大型语言模型(LLMs)及其他应用设计的持久内存工具,采用内容寻址存储技术,具备多项先进特性。该系统通过去重和压缩技术优化存储效率,支持全文检索与语义搜索功能,...

Read More
2025-06-17 talkingdev

NanonetsOCR:将文档转为结构化Markdown模型

Hugging Face平台上的Nanonets-OCR-s项目近日引发技术社区关注,该OCR模型能够将复杂文档(如PDF、扫描件)高效转换为结构化Markdown格式,解决了传统OCR输出非结构化数据的行业痛点。其技术亮点包括基于深度学习的...

Read More
2025-05-07 talkingdev

NVIDIA推出Radio文本与图像嵌入模型,性能媲美SigLIP

NVIDIA近期在Hugging Face Hub上发布了一系列文本与图像嵌入模型(Radio系列),其性能在多项基准测试中达到或超越当前热门的SigLIP模型。这些模型通过先进的神经网络架构优化了多模态数据的向量表示能力,可广泛应...

Read More
  1. Next Page