漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-15 talkingdev

揭秘大语言模型(LLM)的文本处理机制:Tokenization如何塑造AI世界观

语言模型(LLM)通过Tokenization技术将文本分解为更小的单元,再转换为数值表示进行处理。这一过程涉及BPE(字节对编码)、WordPiece和SentencePiece等主流算法,直接影响模型的计算成本、上下文理解能力和多语言处理...

Read More
2025-08-15 talkingdev

论文推荐|可证明的上下文向量算术:通过检索任务概念实现

近期,一项关于大语言模型(LLM)上下文学习(ICL)能力的研究取得了重要突破。研究人员提出了一种理论框架,解释了非线性残差变换器如何通过向量算术执行事实召回ICL任务。该研究基于分层概念建模,证明了通过梯度...

Read More
2025-08-15 talkingdev

Anthropic推出MCP协议:探索基础模型工具使用效能

Anthropic公司推出的模型上下文协议(Model Context Protocol,MCP)旨在标准化大型语言模型(LLM)对外部工具的使用方式,正迅速成为工具集成的行业规范。该开源框架通过结构化接口,使AI代理能够更高效地调用外部A...

Read More
2025-08-15 talkingdev

Baseten推出高性能开源大模型API服务,支持Kimi K2、GPT-OSS等前沿模型

Baseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的...

Read More
2025-08-14 talkingdev

iMessage MCP:让LLM本地读取你的iMessage信息

开发者Wyatt Joh近日在JSR平台发布了两个开源工具包@wyattjoh/imessage和@wyattjoh/imessage-mcp,这些工具允许大型语言模型(LLM)如Claude在macOS系统上以只读方式访问用户的iMessage数据库。这一创新技术使用户能...

Read More
2025-08-14 talkingdev

开源|Void:基于VS Code的AI代码编辑器,支持直接连接任意LLM

Void是一款开源的AI代码编辑器,源自VS Code,具备多项前沿功能。它支持直接连接任何大型语言模型(LLM),无论是本地还是云端部署,无需后端中间层,确保了数据的完全隐私性。此外,Void还提供了代理模式、变更检查...

Read More
2025-08-14 talkingdev

AI流量激增527%,搜索引擎优化(SEO)面临重大变革

最新数据显示,从1月到5月,由人工智能驱动的网络流量激增527%,以ChatGPT和Perplexity为代表的大型语言模型(LLMs)正在重塑用户与互联网的互动方式。法律、金融和健康行业在AI来源的会话中处于领先地位,这表明用...

Read More
2025-08-13 talkingdev

Claude Sonnet 4上下文窗口突破100万tokens,开启大规模代码分析与文档合成新纪元

Anthropic公司宣布其Claude Sonnet 4模型现已支持高达100万tokens的上下文窗口,这一重大升级使其处理能力提升了5倍。这一突破性进展意味着该模型能够胜任更复杂、数据密集型的任务,如大规模代码库的深度分析和长文...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page