漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-18 talkingdev

MiniMax开源推理模型M1:混合专家架构+闪电注意力

人工智能公司MiniMax在GitHub开源了其4560亿参数规模的推理模型M1,该模型采用创新的混合专家架构(MoE)并引入'闪电注意力'技术,实现百万token级别的超长上下文处理能力(相当于DeepSeek R1的8倍)。特别值得注意...

Read More
2025-05-17 talkingdev

KVSplit开源-苹果上运行更长上下文的LLM,内存减少59%

近日,开发者dipampaul17在GitHub上发布了KVSplit项目,该项目通过差异化精度的KV缓存量化技术,在苹果芯片(M1/M2/M3/M4)上实现了更长上下文的LLM推理。研究发现,LLM推理中的KV缓存中,键(Keys)和值(Values)...

Read More
2025-05-08 talkingdev

KCC开源:专为电子墨水屏设计的漫画转换工具

Kindle Comic Converter(KCC)是一款专为电子墨水屏设备优化的漫画和漫画转换工具,支持Kindle、Kobo、ReMarkable等多种电子阅读器。该工具通过去除页边距、支持固定布局以及针对电子墨水屏特性的图像处理,确保漫...

Read More
2025-04-18 talkingdev

Milwaukee M18电池组逆向工程揭秘:技术细节与潜在应用

近日,一项针对Milwaukee M18电池组的逆向工程研究引发了业界广泛关注。该研究通过拆解和分析M18电池组的内部结构,揭示了其在电池管理系统(BMS)、充放电控制以及安全保护机制等方面的技术细节。M18电池组作为专业...

Read More
2025-04-17 talkingdev

[论文推荐]M1:基于Mamba推理模型的可扩展测试时间计算研究

M1是一种基于Mamba架构的推理模型,通过扩展测试时间计算进行训练。虽然尚未完全达到最先进模型的水平,但M1在长上下文处理和高吞吐量任务中表现出色。这一突破为大规模语言模型的推理效率提供了新的研究方向,特别...

Read More
2024-11-01 talkingdev

苹果M1/M2 GPU驱动程序更新解读

近日,苹果公司对其M1和M2系列的GPU驱动程序进行了重要更新。本次更新主要旨在提升图形处理性能和兼容性,尤其是在高负载应用场景下的表现。更新内容包括对多种图形软件的优化,使得开发者能够更好地利用M1和M2的硬...

Read More
2024-07-23 talkingdev

一起打造StoryTeller:Andrej Karpathy的LLM101n

Andrej Karpathy最近在GitHub上发布了一个新的仓库,概述了他正在进行的一个新课程。这个课程涉及到构建一个能够讲述故事的对齐语言模型。课程包括视频讲座、代码以及其他学习材料。Karpathy的这个项目是一次尝试,...

Read More
2024-06-24 talkingdev

LLM101开源教程:用AI打造故事讲述者

Andrej Karpathy发布了一个新的仓库,这是他正在进行的一个新课程的大纲。课程涉及构建一个可以讲述故事的对齐语言模型。课程包括视频讲座、代码和其他学习材料。这是一个主要围绕人工智能和机器学习的课程,强调对...

Read More
  1. Next Page