上下文的相关内容 - 漫话开发者

2025-04-17 talkingdev

OpenAI发布o3和o4-mini模型：集成多模态能力，推理速度与工具使用全面升级

OpenAI正式推出新一代o3和o4-mini模型，标志着大语言模型在功能整合与推理效率上的重大突破。该系列模型通过深度融合网络搜索、文件解析及图像生成三大核心能力，显著提升了ChatGPT的复杂任务处理水平。技术层面，o4...

2025-04-15 talkingdev

OpenAI最新发布了名为BrowseComp的基准测试，包含1,266个问题，专门用于评估AI代理在互联网上搜集复杂且难以定位信息的能力。这一基准测试的推出标志着AI在信息检索领域的重要进展，尤其是在处理需要多步骤推理和跨...

2025-04-15 talkingdev

OpenAI近日在其API中推出了三款全新模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编码和指令遵循方面表现优异，全面超越了之前的GPT-4o和GPT-4o mini。新模型不仅具备更大的上下文窗口，支持高达100万toke...

2025-04-07 talkingdev

Sparks是一套创新的字体系统，它允许用户在文本中嵌入sparklines（迷你图表），而无需编写任何代码。通过利用OpenType字体的上下文交替功能，Sparks能够对数字进行简单的替换操作以生成图表。该字体适用于桌面和网络...

2025-04-07 talkingdev

谷歌宣布其新一代多模态大模型Gemini 2.5 Pro正式进入公测阶段，开发者现可通过Google AI Studio的Gemini API进行体验，而企业级平台Vertex AI的支持也即将上线。作为Gemini系列的最强版本，2.5 Pro在跨模态理解、长...

2025-04-07 talkingdev

Meta最新发布的Llama 4模型通过创新性的混合位置编码策略，实现了超过1000万tokens的上下文处理能力。该技术核心在于交替使用无位置嵌入（NoPE）和旋转位置嵌入（RoPE），在保持计算效率的同时显著扩展了上下文窗口...

2025-04-04 talkingdev

Nebius近日开源了Kvax项目，这是一个基于JAX框架的Flash Attention实现，专门针对长上下文训练场景进行了优化。Kvax通过创新的上下文并行技术和高效的文档掩码计算，实现了更快的训练速度和更高的数据密度压缩，在性...

2025-03-31 talkingdev

传统检索增强生成（RAG）系统采用语义搜索+文档生成的二阶段流程，虽能实现基础问答，但存在上下文理解浅层化和无关信息干扰的缺陷。GitHub最新开源的ReAG（Reasoning Augmented Generation）通过革命性的一体化架构...