漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-10 talkingdev

论文推荐|BlockRank:生成式模型实现可扩展上下文排序,效率提升4.7倍

近日,信息检索领域迎来突破性进展——基于生成式模型的上下文排序(ICR)技术实现规模化应用。传统ICR方法通过将任务描述、候选文档和查询直接输入大语言模型(LLM)来识别相关文档,虽效果显著但存在计算效率瓶颈:...

Read More
2025-09-26 talkingdev

Perplexity发布Search API,开放其百亿级网页检索基础设施

人工智能公司Perplexity正式推出全新Search API服务,该API允许开发者直接调用其公共问答引擎背后的大规模基础设施,实现对数千亿网页的高质量信息检索。这一技术突破意味着第三方开发者能够利用Perplexity经过优化...

Read More
2025-08-18 talkingdev

Qwen3-Embedding-0.6B模型实现百万级文本高效嵌入,GPU利用率近100%

近日,Qwen3-Embedding-0.6B模型在文本嵌入领域取得重大突破,能够高效处理百万级文本数据,并实现接近100%的GPU利用率。该技术流程包括从S3读取文档、使用spaCy进行句子分块、利用Qwen3生成嵌入向量,并将结果写入t...

Read More
2025-08-14 talkingdev

AI流量激增527%,搜索引擎优化(SEO)面临重大变革

最新数据显示,从1月到5月,由人工智能驱动的网络流量激增527%,以ChatGPT和Perplexity为代表的大型语言模型(LLMs)正在重塑用户与互联网的互动方式。法律、金融和健康行业在AI来源的会话中处于领先地位,这表明用...

Read More
2025-07-30 talkingdev

OpenAI推出ChatGPT学习模式:逐步引导取代快速答案

OpenAI近日在ChatGPT中推出了名为“学习模式”的新功能,旨在通过逐步引导用户解决问题,而非直接提供答案,从而改变传统的学习体验。该功能利用定制化的系统指令,鼓励用户主动参与,管理认知负荷,并促进自我反思。...

Read More
2025-07-22 talkingdev

无需解析文档:直接使用图像进行RAG检索

从复杂的PDF中提取信息一直是个棘手的问题。行业在OCR(光学字符识别)、布局检测和解析流程上投入了大量精力和资金,却仍可能丢失最关键的信息。如今,视觉语言模型(Vision Language Models)已经足够强大,能够直...

Read More
2025-07-02 talkingdev

Sentence Transformers推出稀疏编码器微调功能,助力混合搜索与重排序

Sentence Transformers最新升级引入对稀疏嵌入模型训练的支持,这一技术突破特别适用于混合搜索和重排序场景。该博客详细解析了模型的核心组件与训练步骤,并重点介绍了基于SPLADE架构的现成模型。稀疏编码技术通过...

Read More
2025-06-09 talkingdev

[开源]阿里开源Qwen3 Embedding系列模型,8B版本登顶MTEB多语言榜单

阿里巴巴近日开源了Qwen3 Embedding系列模型,其8B参数版本在权威的MTEB多语言排行榜上位列第一。这一系列模型为开发者提供了构建RAG系统、语义搜索引擎和文档检索应用的强大工具,支持超过100种语言的处理需求。模...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page