漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-07 talkingdev

开源|月之暗面Kimi K2推理模型:多项基准超越GPT-5与Claude Sonnet 4.5

中国人工智能实验室月之暗面(Moonshot AI)近日开源其革命性推理模型Kimi K2,在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’(Humanity's Last Exam)中取得44.9%的...

Read More
2025-11-07 talkingdev

月之暗面发布开源模型Kimi K2 Thinking,宣称在智能体能力上超越GPT-5

中国人工智能初创公司月之暗面(Moonshot)于11月6日正式推出新一代开源生成式AI模型Kimi K2 Thinking。该模型在智能体(Agentic)能力方面表现突出,据称已超越OpenAI的GPT-5水平,成为当前开源领域最具竞争力的AI...

Read More
2025-11-05 talkingdev

Grab自研视觉大模型文档处理,破解东南亚多语言OCR难题

东南亚科技巨头Grab近日宣布成功研发定制化视觉大语言模型,彻底革新传统OCR文档处理流程。该模型针对东南亚地区非标准化文档格式及多语言混合场景进行专项优化,通过重构开源架构实现推理速度提升50%,同时保持高精...

Read More
2025-11-05 talkingdev

超越标准大语言模型:线性注意力混合架构与文本扩散模型引领新浪潮

当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型,但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升,更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本,在创造...

Read More
2025-10-31 talkingdev

资深工程师揭秘:8大科技巨头面试全对比,算法与行为面试仍是高级职位关键

一位资深软件工程师在近期求职过程中,系统性参与了包括Meta、亚马逊、优步等八家顶级科技公司的面试流程,最终成功获得Atlassian首席软件工程师职位。在累计超过60场面试的实践中,他发现即使针对高级别技术岗位,...

Read More
2025-10-31 talkingdev

Hugging Face发布《Smol训练手册》:揭秘构建顶尖大语言模型的完整实战指南

知名AI社区Hugging Face近日发布了一份名为《Smol训练手册》的深度技术指南,首次系统披露了从零开始训练大语言模型的全流程实战经验。该手册覆盖了模型训练生命周期的关键阶段:从小规模消融实验和基础设施调试,到...

Read More
2025-10-30 talkingdev

OpenAI发布gpt-oss-safeguard:可定制安全策略的推理模型

OpenAI最新推出的gpt-oss-safeguard系列模型(包含1200亿和200亿参数版本)标志着AI安全技术的重要突破。该模型创新性地允许开发者在推理阶段直接应用定制化安全策略,无需像传统方法那样依赖数千个标注样本训练分类...

Read More
2025-10-29 talkingdev

开源|Dexto:构建能思考、行动与对话的AI智能体开发框架

近日,GitHub开源项目Dexto引发开发者社区广泛关注。作为专为AI智能体设计的智能层框架,Dexto通过协调大语言模型、工具链与数据源,将自然语言指令转化为可执行动作。其核心价值在于提供配置驱动的开发范式,支持命...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page