大模型的相关内容 - 漫话开发者

2026-07-21 talkingdev

AMD发布首款机架级AI系统Helios挑战英伟达，微软火速成为最新客户

AMD正式发布了其首款机架级人工智能系统Helios，直接对标英伟达的同类产品，标志着AI基础设施竞赛进入全新阶段。该系统将数据中心级的算力、高速互连与能效优化深度整合在单一机架内，能够为千亿乃至万亿参数大模型...

2026-07-20 talkingdev

该观点将当前的大语言模型竞争与上世纪90年代的数据库之争进行了历史性类比，揭示了技术基础设施演进的一种深层规律。作者认为，大语言模型正沿着数据库的发展轨迹前进：从最初作为引发行业狂热的前沿技术，逐步演化...

2026-07-20 talkingdev

LoopGain 是一款专为 AI 智能体循环设计的开源成本控制器，致力于解决当前多智能体框架中普遍存在的“固定最大迭代次数”所导致的算力浪费和输出质量退化问题。其核心创新在于引入实时“环路增益（Aβ）”监测机制：当系...

2026-07-20 talkingdev

月之暗面（Moonshot AI）在GitHub正式开源了一款名为Kimi Code CLI的终端AI编程工具，它被定位为“下一代智能体的起点”。该工具本质上是一个运行在命令行终端中的AI编程智能体，能够自主阅读和编辑代码、执行Shell命...

2026-07-20 talkingdev

阿里巴巴通义千问团队正式公布Qwen3.8，这是一款参数规模高达2.4万亿的超大规模语言模型，并明确表示将以开放权重（Open-Weight）的方式面向全球发布。这不仅是Qwen系列模型参数的又一次飞跃，也反映出阿里巴巴在开...

2026-07-18 talkingdev

据彭博社报道，日本正计划从英伟达采购27,500颗下一代Rubin芯片，用以构建一个面向机器人领域的国产基础人工智能模型。该项目由Noetra牵头，联合软银、索尼及NEC等科技巨头共同推进，被视为日本在“主权AI”战略上的重...

2026-07-18 talkingdev

由企业软件巨头Apptio联合创始人Sunny Gupta等人创办的AI初创公司Thira正式走出隐秘模式，宣布获得由老牌风投Madrona领投的2100万美元种子轮融资。Thira聚焦利用AI代理（AI Agents）接手IT支持、财务对账等繁琐的企...

2026-07-18 talkingdev

中国国家数据管理局最新数据显示，2026年3月全国每日AI令牌消耗量已突破140万亿枚，较2025年12月的100万亿枚和2024年初的1000亿枚呈指数级增长。这一数字背后折射出中国科技巨头在人工智能领域的疯狂竞速，大模型训...