漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-29 talkingdev

ClickHouse发布2800万条Hacker News评论向量搜索数据集

数据分析平台ClickHouse近日正式发布Hacker News向量搜索数据集,该数据集包含超过2800万条Hacker News社区评论及其对应的向量嵌入表示。这一数据集将成为开发者和研究人员构建语义搜索系统、推荐算法和自然语言处理...

Read More
2025-11-07 talkingdev

谷歌Gemini API推出文件搜索工具:内置RAG系统,简化检索任务

谷歌近日在Gemini API中正式推出文件搜索工具(File Search),这是一个完全托管的检索增强生成(RAG)系统,直接集成于API架构中。该系统通过向量搜索技术实现高效语义匹配,并自动生成引用来源,支持包括PDF、Word...

Read More
2025-09-01 talkingdev

Weaviate发布8位旋转量化技术:向量搜索速度提升4倍同时优化精度

Weaviate团队最新提出的8位旋转量化技术(8-bit Rotational Quantization)突破了向量搜索领域的性能瓶颈。该技术通过创新性地采用随机旋转算法,将原始向量数据压缩至原大小的1/4,在显著减少存储空间和内存占用的...

Read More
2025-08-27 talkingdev

反对Claude Code仅用Grep检索?Token消耗暴增40%成硬伤,向量检索方案突破效率瓶颈

当前AI编程助手在代码库上下文检索领域存在技术路线分歧:传统关键词检索(grep)与向量搜索驱动的RAG架构形成鲜明对比。研究显示,虽然grep具备速度快、结果精确的优势,但其机械式匹配会导致大量无关结果泛滥,不...

Read More
2025-08-13 talkingdev

从零构建搜索引擎:两个月内完成30亿神经嵌入的Web搜索系统

本文深度剖析了一个从零构建的Web搜索引擎项目,该项目在短短两个月内实现了包括30亿SBERT神经嵌入生成、2.8亿网页爬取与索引、查询延迟优化及服务网格部署等核心技术突破。项目团队动用了200块GPU组成的计算集群,...

Read More
2024-08-07 talkingdev

Postgres的全文搜索:Elasticsearch与其他替代方案的对比

PostgreSQL是一种流行的关系型数据库,它提供了强大的查询和数据分析功能。然而,它在全文搜索方面的性能并不是很好。为了解决这个问题,许多人选择使用Elasticsearch这样的搜索引擎来处理全文搜索。但是,除了Elast...

Read More
2024-08-03 talkingdev

Sqlite-vec:全平台运行的向量搜索SQLite扩展

Sqlite-vec是一个正在开发中的SQLite扩展,可以在任何平台上运行并支持向量搜索。由于其高度可定制性,它可以轻松地与各种应用程序集成。该扩展使用基于向量的搜索算法,可用于图像搜索、音频分类、推荐系统等应用程...

Read More
2024-02-26 talkingdev

Marqo融资1250万美元,帮助企业构建生成式AI应用

向量搜索公司Marqo在由Lightspeed领导的A轮融资中筹集了1250万美元,以推进其下一代向量搜索平台的采用。Marqo的平台解锁了非结构化数据的巨大价值,覆盖了包括最终用户搜索、检索增强生成等关键企业应用,帮助企业...

Read More
  1. Next Page