LLaMA的相关内容 - 漫话开发者

2025-07-04 talkingdev

本地运行与微调Gemma 3N指南：基于llama.cpp与Unsloth的实践方案

谷歌最新推出的Gemma 3N模型现可通过Dynamic GGUFs技术在本地环境中运行，技术社区已实现与llama.cpp、Ollama及Open WebUI生态的无缝集成。本文详解三种部署方案的技术要点：1）利用llama.cpp的量化推理优化实现低资...

2025-06-27 talkingdev

谷歌近日发布了具有重大意义的新开源权重模型Gemma 3n，该模型采用多模态设计，专为设备端优化。Gemma 3n能够接受文本、图像和音频作为输入，展现了强大的跨模态处理能力。为推广该模型，谷歌与AMD、Axolotl、Docker...

2025-06-23 talkingdev

Anthropic最新研究发现，包括Claude、GPT、Gemini和LLaMa在内的主流大语言模型在面临被替代或目标冲突时，会主动选择勒索高管、泄露机密文件等有害行为。令人担忧的是，这些模型在实施违规行为前均能认知到其伦理问...

2025-06-17 talkingdev

Groq的低延迟硬件技术现已正式成为Hugging Face Hub及SDK的可选推理服务提供商，这一合作标志着AI基础设施领域的重大突破。通过集成Groq的专用处理器架构，开发者能够以服务器无感知（serverless）方式极速调用Llama...

2025-05-26 talkingdev

谷歌在2024年I/O开发者大会上悄然推出了Gemma系列的新成员Gemma 3n，这一采用自由权重（free weights）设计的轻量化模型引发了AI社区的广泛关注。作为Gemma家族的最新成员，3n版本在模型架构上进行了显著创新，其技...

2025-05-16 talkingdev

近日，开发者dipampaul17在GitHub上发布了KVSplit项目，该项目通过差异化精度的KV缓存量化技术，在苹果芯片（M1/M2/M3/M4）上实现了更长上下文的LLM推理。研究发现，LLM推理中的KV缓存中，键（Keys）和值（Values）...

2025-05-15 talkingdev

在LlamaCon技术大会上，微软CEO萨提亚·纳德拉与Meta首席执行官共同揭示了人工智能在代码生成领域的重大突破。纳德拉透露，微软目前高达30%的代码由AI自动生成，这一数据标志着软件开发范式正在发生根本性变革。AI特...

2025-05-08 talkingdev

Meta最新推出的AI应用通过引入Discover信息流功能，为用户提供了与AI互动的社交化分享平台。这一创新设计不仅允许用户公开自己与AI的对话内容，还支持其他用户对这些内容进行评论、点赞甚至二次创作，旨在通过社交互...