大模型的相关内容 - 漫话开发者

2025-08-18 talkingdev

中国开源大模型研发机构排名：DeepSeek领跑，Moonshot AI与智谱AI紧追其后

近日，一份针对中国19家人工智能实验室的排名报告引发行业关注。该排名并非基于模型原始性能，而是聚焦各机构对AI研究的贡献度。长期领跑的DeepSeek实验室虽近期相对低调，仍保持领先地位。值得注意的是，新兴力量如...

2025-08-15 talkingdev

Anthropic公司推出的模型上下文协议（Model Context Protocol，MCP）旨在标准化大型语言模型（LLM）对外部工具的使用方式，正迅速成为工具集成的行业规范。该开源框架通过结构化接口，使AI代理能够更高效地调用外部A...

2025-08-15 talkingdev

Baseten近日推出其Model APIs服务，旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型，承诺提供行业领先的性能表现和极具竞争力的...

2025-08-14 talkingdev

苹果公司近日在GitHub开源了Embedding Atlas项目，这是一款专为大规模嵌入数据设计的交互式可视化工具。该工具通过WebGPU加速实现高性能渲染，支持自动数据聚类标注、实时交叉筛选和元数据搜索三大核心功能。其技术...

2025-08-13 talkingdev

Anthropic公司宣布其Claude Sonnet 4模型现已支持高达100万tokens的上下文窗口，这一重大升级使其处理能力提升了5倍。这一突破性进展意味着该模型能够胜任更复杂、数据密集型的任务，如大规模代码库的深度分析和长文...

2025-08-11 talkingdev

近日，一篇深度分析文章《From GPT-2 to GPT-OSS: Analyzing the Architectural Advances》引发技术社区广泛讨论。文章系统梳理了从GPT-2到最新GPT-OSS（开源GPT模型）的架构演进历程，重点对比了其与阿里云Qwen3的...

2025-08-10 talkingdev

一篇题为《GPTs and Feeling Left Behind》的深度文章引发技术社区广泛讨论，文章指出随着GPT系列模型的迭代速度不断加快，从业者正面临前所未有的技能焦虑。这种现象在Hacker News社区引发105点热议和73条深度评论...

2025-08-09 talkingdev

据开发者社区热议，OpenAI在未提前公告的情况下，突然终止了ChatGPT普通用户对GPT-4o模型的访问权限，这一决策在Reddit的r/ChatGPT板块引发强烈反响。技术博主Simon Willison披露，该事件恰逢GPT-5发布窗口期，社区...