近日,开发者社区GitHub上出现了一项名为SqueezeAttention的新技术,该技术针对大型语言模型(LLMs)的键值缓存进行了优化。通过SqueezeAttention,内存使用量能够显著降低30%至70%,同时吞吐量也得到了翻倍提升。这...
Read More微软计划于5月20日在西雅图举行的活动上展示其对AI PC的愿景。公司对新款Arm架构Windows笔记本充满信心,认为其将在CPU性能和AI加速任务方面超越苹果搭载M3芯片的MacBook Air。这些笔记本将搭载高通的Snapdragon X E...
Read More人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...
Read More目前的软件在理解和辅助多样化任务方面仍然有限。比尔·盖茨预测,AI智能体将革新软件交互,提供个性化的帮助,无需特定的应用程序,这是自从从命令行界面转向图形界面以来的最大变革。
Read More