漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-16 talkingdev

英伟达CEO黄仁勋盛赞DeepSeek、阿里、腾讯AI模型为“世界级”,并称H20芯片美国许可“将很快获批”

英伟达(NVIDIA)CEO黄仁勋在近日的北京科技博览会上高度评价了中国企业DeepSeek、阿里巴巴和腾讯的人工智能模型,称它们已达到“世界级”水平。黄仁勋还透露,美国对英伟达H20芯片的出口许可审批“将很快完成”。这一表...

Read More
2025-07-02 talkingdev

华为开源PanguAI模型及推理技术 加速全球AI市场布局

华为宣布将开源其PanguAI系列中的两个核心模型及部分推理技术,这一战略举措旨在推动全球人工智能技术的普及与应用。作为中国AI领域的领军企业,华为此次开源不仅展示了其在自然语言处理和多模态AI领域的技术积累,...

Read More
2025-05-29 talkingdev

DeepSeek-R1-0528:开源大模型新突破

DeepSeek团队在Hugging Face平台发布了最新的大语言模型DeepSeek-R1-0528,引发了技术社区的广泛关注。该模型在Hacker News上获得了330个点赞和148条评论,显示出业界对其技术价值的认可。作为开源大模型领域的重要...

Read More
2025-05-05 talkingdev

阿里巴巴发布Qwen 3系列AI模型,号称可媲美谷歌与OpenAI顶级模型

阿里巴巴近日正式推出Qwen 3系列人工智能模型,该系列模型采用混合专家架构(Mixture of Experts),具备先进的推理能力,并宣称其性能可媲美谷歌和OpenAI的顶级模型。Qwen 3系列模型支持119种语言,训练数据规模高...

Read More
2025-05-05 talkingdev

[开源]WebThinker:赋能大语言模型的深度研究框架

中国人民大学自然语言处理实验室推出的WebThinker框架,标志着大语言模型(LRMs)向自主科研领域迈出关键一步。该开源项目通过构建深度研究架构,使LRMs具备三项突破性能力:1)智能化的全网信息检索系统,可自主定...

Read More
2025-05-01 talkingdev

国产x86处理器新突破:兆芯KX-7000架构深度解析

作为中国自主x86处理器设计商,兆芯最新发布的KX-7000系列处理器引发行业广泛关注。该处理器采用全新微架构设计,在芯片性能、能效比及指令集兼容性方面实现显著提升,标志着国产CPU在核心技术领域的又一重要突破。...

Read More
2025-04-28 talkingdev

DeepSeek发布2025年新一代AI模型R2,引领大语言模型技术革新

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2,这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露,R2模型将采用创新的混合架构设计,整合了稀疏专家模型(MoE)与密...

Read More
2025-04-07 talkingdev

[论文推荐]DeepSeek提出推理时缩放技术,革新通用奖励模型训练范式

DeepSeek最新研究论文《Inference-Time Scaling for Generalist Reward Modeling》提出了一种创新方法,通过推理时缩放技术优化奖励模型,从而引导更强大的推理模型生成。该技术标志着这家中国初创公司的一项战略布...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page