近日,GitHub上出现了一个名为Gemma Gem的开源项目,它是一个Chrome浏览器扩展,能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于,它通过新兴的WebGPU API来实现高性能...
Read More一项名为‘简单自蒸馏’(Simple Self-Distillation, SSD)的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于,仅利用模型自身在特定采样配置(如温度参数和截断策略)下生成...
Read More近日,一项名为“LLM Wiki”的创新框架在开发者社区引发关注。该框架的核心是一个可被复制并粘贴到大语言模型(LLM)智能体中的“想法文件”,旨在为利用LLM构建和维护知识库提供一套系统化模式。在这一协作框架下,人类...
Read More近日,科技界发生了一件颇具象征意义的事件:苹果公司批准了一款允许Nvidia外置显卡(eGPU)在基于Arm架构的Mac电脑上工作的驱动程序。这款驱动并非由Nvidia官方提供,而是来自一家名为Tiny Corp的公司。其最大突破...
Read More近日,AI领域知名专家、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)在社交媒体上分享了一个名为“LLM Wiki”的GitHub Gist项目,并将其描述为一个“灵感文件”(idea file)的范例。该项目迅速在技术社区引发关注...
Read More人工智能公司Anthropic近日向用户发出通知,宣布自太平洋时间4月4日中午12点起,将调整其Claude API的使用政策。根据新规,用户将无法再使用其Claude订阅额度(包括Claude Code和Claude Cowork产品)通过第三方集成...
Read More阿里云通义千问团队近日发布了其最新旗舰模型Qwen3.6-Plus,标志着其在构建面向真实世界的智能体(Agents)道路上迈出了关键一步。该模型在多模态感知与推理能力上实现了显著提升,能够更精准地理解世界,为开发者生...
Read More近日,OpenMed团队在Hugging Face平台发布了一项重要成果,展示了其构建的端到端蛋白质AI全流程。该流程涵盖了蛋白质结构预测、序列设计以及关键的密码子优化环节。研究团队对多种Transformer架构进行了深入的密码子...
Read More