大语言模型的相关内容 - 漫话开发者

2025-08-13 talkingdev

Claude Sonnet 4上下文窗口突破100万tokens，开启大规模代码分析与文档合成新纪元

Anthropic公司宣布其Claude Sonnet 4模型现已支持高达100万tokens的上下文窗口，这一重大升级使其处理能力提升了5倍。这一突破性进展意味着该模型能够胜任更复杂、数据密集型的任务，如大规模代码库的深度分析和长文...

2025-08-13 talkingdev

Anthropic公司宣布其AI模型Claude Sonnet 4现支持高达100万tokens的上下文窗口，较之前版本实现了5倍的性能飞跃。这一突破性升级通过Anthropic API向开发者开放，标志着大语言模型处理长文档、复杂对话和跨文档分析...

2025-08-12 talkingdev

随着现代AI应用日益依赖大语言模型（LLM）生成结构化数据，如何高效流式传输这些输出成为技术挑战。全球AI平台推出的开源项目LangDiff提供了一种创新解决方案——这款Python库专为结构化LLM输出流式传输至前端而设计，...

2025-08-11 talkingdev

针对OpenAI发布GPT-5引发的行业震动，本文提出三项关键预判：首先，类比计算器未使学生丧失运算能力，大语言模型（LLM）不会导致人类思维退化，但产业与年轻从业者需经历技术适应期；其次，通用人工智能（AGI）短期...

2025-08-11 talkingdev

近日，一篇深度分析文章《From GPT-2 to GPT-OSS: Analyzing the Architectural Advances》引发技术社区广泛讨论。文章系统梳理了从GPT-2到最新GPT-OSS（开源GPT模型）的架构演进历程，重点对比了其与阿里云Qwen3的...

2025-08-10 talkingdev

据彭博社报道，以Anthropic和OpenAI为代表的人工智能初创公司正在加速从华尔街金融机构招募量化研究员，提供极具竞争力的薪酬和福利。在曼哈顿下东区的一个屋顶酒吧，约150名量化研究员与Anthropic的员工进行了会面...

2025-08-08 talkingdev

Octo 是一款开源编程助手，以其友好性和灵活性受到开发者关注。它兼容 OpenAI 和 Anthropic 等主流大语言模型（LLM）API，允许开发者在对话中随时切换模型，以应对特定模型无法解决的问题。此外，Octo 支持用户使用...

2025-08-06 talkingdev

OpenAI近日正式推出两款开源权重推理模型gpt-oss-120b和gpt-oss-20b，标志着其在开放生态建设上的重大进展。这两款模型采用Apache 2.0许可证，允许用户自由定制并应用于商业场景，其显著特性包括支持智能体任务处理...