大模型的相关内容 - 漫话开发者

2025-11-07 talkingdev

月之暗面发布开源模型Kimi K2 Thinking，宣称在智能体能力上超越GPT-5

中国人工智能初创公司月之暗面（Moonshot）于11月6日正式推出新一代开源生成式AI模型Kimi K2 Thinking。该模型在智能体（Agentic）能力方面表现突出，据称已超越OpenAI的GPT-5水平，成为当前开源领域最具竞争力的AI...

2025-11-05 talkingdev

东南亚科技巨头Grab近日宣布成功研发定制化视觉大语言模型，彻底革新传统OCR文档处理流程。该模型针对东南亚地区非标准化文档格式及多语言混合场景进行专项优化，通过重构开源架构实现推理速度提升50%，同时保持高精...

2025-11-04 talkingdev

谷歌Angular团队近日正式开源Web Codegen Scorer工具，专门用于评估大型语言模型生成的Web代码质量。该工具通过建立标准化的代码质量评估体系，支持跨模型、跨框架的横向对比分析，为AI代码生成技术的优化提供量化依...

2025-10-24 talkingdev

谷歌Angular团队正式开源Web Codegen Scorer工具，专门用于评估大语言模型生成的网页代码质量。该工具通过构建成功率、安全漏洞检测、编码规范遵循等核心维度，对LLM生成的HTML/CSS/JavaScript代码进行量化评分。开...

2025-10-21 talkingdev

DeepSeek-AI团队最新开源的DeepSeek-OCR项目在长上下文压缩技术领域实现重要突破。该项目通过创新的光学二维映射技术，探索将长文本上下文进行高效压缩的可行性。系统由DeepEncoder核心引擎和DeepSeek3B-Moe-A570M解...

2025-10-20 talkingdev

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破，通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片，降幅达82%。该系统目前已在阿里云模型市场完成beta测试，其核心技...

2025-10-17 talkingdev

近日，开发者通过Google AI Studio的A/B测试功能，意外捕捉到尚未正式发布的Gemini 3.0模型踪迹。该测试以SVG矢量图形生成作为核心评估标准，通过对比不同版本模型的输出质量，间接验证了新一代模型在复杂结构化数据...

2025-10-16 talkingdev

最新技术测试显示，Anthropic公司新推出的Claude Haiku 4.5模型在WebSocket重构任务中表现出令人深思的现象。该模型虽然生成了比其他模型更多的代码量，但其代码质量评分却显著低于同系列的Claude Sonnet 4.5模型。...