漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-22 talkingdev

卡帕西年度回顾:2025年大语言模型的五大范式变革

人工智能领域知名专家安德烈·卡帕西(Andrej Karpathy)近期发布了其对2025年大语言模型(LLM)发展的年度回顾,系统性地梳理了行业在过去一年中经历的深刻范式转变。报告指出,技术演进的核心驱动力已从单纯追求模...

Read More
2025-12-20 talkingdev

2025年大语言模型范式变革年度回顾:关键趋势与未来展望

知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...

Read More
2025-12-07 talkingdev

Oxide公司深度揭秘:如何将大型语言模型(LLMs)融入其技术栈与实践

近日,Oxide Computer公司在其官方技术文档平台RFD(Request for Discussion)上发布了一篇题为《在Oxide使用LLMs》的深度技术文章,引发了技术社区的广泛关注。该文章详细阐述了Oxide作为一家专注于构建现代、一体...

Read More
2025-07-24 talkingdev

TimeScope:你的视频大模型能处理多长的视频?

TimeScope是一个全新的开源基准测试工具,专门用于评估视觉大模型在处理长视频方面的能力。它不仅测试模型的检索能力,还涵盖了视频合成、时间定位以及细粒度运动分析等多个维度,从而提供对模型时间理解能力的全面...

Read More
2025-07-22 talkingdev

[开源]MoonshotAI发布Kimi K2技术报告:突破万亿参数模型训练瓶颈

月之暗面(MoonshotAI)团队最新发布的Kimi K2技术报告揭示了其大型语言模型系列的重大技术突破。该团队创新性地开发出MuonClip技术,通过将token高效的Muon优化器与新型QK-Clip技术相结合,成功解决了万亿参数模型训...

Read More
2025-07-18 talkingdev

AI模型或将趋同:柏拉图表示假说揭示通用嵌入的可能性

最新研究发现,随着AI模型规模的扩大和智能的提升,它们正在向信息的通用表示方式收敛。这一现象被称为'柏拉图表示假说',认为由于现实的单一性,模型会学习到越来越相似的数据特征和关系。该假说的一个实际应用是开...

Read More
2025-07-10 talkingdev

[论文推荐]猫咪干扰大模型推理:无关信息触发推理模型错误率激增300%

最新研究发现,在数学问题中插入诸如'有趣的事实:猫一生大部分时间在睡觉'等无关短语,会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性,且蒸馏版模型表现...

Read More
2025-07-03 talkingdev

AI大模型训练成本突破千万美元级 2024年全球已追踪201个超大规模模型

Epoch AI最新研究显示,人工智能领域正经历前所未有的计算规模扩张。2024年全球已追踪到201个计算量超过10²³ FLOPs的AI大模型,较2017年仅有的2个实现指数级增长。尤其值得注意的是,以GPT-4为代表的顶尖模型已突破1...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page