漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-22 talkingdev

Morphik.ai提出视觉文档检索新方法:用图像替代传统OCR解析

Morphik.ai公司创新性地提出了一种基于视觉的文档检索方法,该方法摒弃了传统的OCR(光学字符识别)和解析技术,转而采用文档页面的图像作为处理对象。通过将文档图像分割成小块,并利用视觉Transformer和语言模型,...

Read More
2025-07-17 talkingdev

谷歌搜索迎来Gemini 2.5 Pro与深度搜索功能,AI订阅服务再升级

谷歌宣布为其AI Pro和AI Ultra订阅用户推出搜索功能的重大升级,集成Gemini 2.5 Pro模型并引入深度搜索(Deep Search)技术。这一更新标志着搜索引擎正式进入多轮复杂交互时代,支持用户提交更长查询语句及连续追问...

Read More
2025-07-14 talkingdev

Linux用户的开源版Raycast,开发者自制兼容启动器

知名效率工具Raycast因其强大的搜索、应用启动和扩展功能,深受macOS用户喜爱。然而,长期以来,Linux用户一直未能享受其便利。为弥补这一空白,一位名为ByteAtATime的社区开发者决定亲自操刀,利用暑期时间打造了一...

Read More
2025-07-11 talkingdev

SEO已死,GEO崛起:如何在AI时代保持竞争优势

随着大型语言模型(LLM)和谷歌AI模式等AI搜索接口的兴起,传统的搜索引擎优化(SEO)方法正逐渐失去效力。在这样一个快速变化的科技环境中,品牌需要将注意力转向生成引擎优化(GEO),以应对不断变化的市场需求。GEO...

Read More
2025-07-11 talkingdev

Cactus:支持手机部署LLM/VLM/TTS跨平台框架

开发者Henry和Roman近日推出开源项目Cactus,这是一个专为智能手机设计的跨平台框架,支持本地部署大型语言模型(LLM)、视觉语言模型(VLM)和文本转语音(TTS)模型。与Ollama专注于笔记本和边缘服务器不同,Cactu...

Read More
2025-07-10 talkingdev

Perplexity推出Comet:一款面向研究场景的AI浏览器

人工智能公司Perplexity近日发布了名为Comet的创新浏览器产品,该产品专为研究工作场景设计,深度整合了Perplexity自主研发的搜索与推理引擎技术。Comet浏览器通过AI能力重构了传统浏览器的交互范式,可同时支持工作...

Read More
2025-07-10 talkingdev

[开源] 开发者自制MCP服务器,实现Anna's Archive文档搜索与下载功能

开发者iosifache近日在GitHub上开源了一个MCP服务器项目annas-mcp,该项目旨在为Anna's Archive文档库提供搜索和下载功能,并可直接集成到Claude Desktop界面中使用。由于未找到现有的公开实现方案,开发者自行构建...

Read More
2025-07-08 talkingdev

Morph (YC S23) 发布高速AI代码编辑工具,速度高达4500 tokens/秒

Morph团队近日推出了一款名为Morph的AI代码编辑工具,其核心创新在于能够以每秒4500个令牌(tokens)的速度直接应用AI生成的代码编辑到现有文件中,解决了传统全文件重写或搜索替换方法速度慢、易出错的问题。该工具...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page