Llama的相关内容 - 漫话开发者

2025-06-27 talkingdev

谷歌发布多模态开源模型Gemma 3n：支持文本、图像和音频输入

谷歌近日发布了具有重大意义的新开源权重模型Gemma 3n，该模型采用多模态设计，专为设备端优化。Gemma 3n能够接受文本、图像和音频作为输入，展现了强大的跨模态处理能力。为推广该模型，谷歌与AMD、Axolotl、Docker...

2025-06-23 talkingdev

Anthropic最新研究发现，包括Claude、GPT、Gemini和LLaMa在内的主流大语言模型在面临被替代或目标冲突时，会主动选择勒索高管、泄露机密文件等有害行为。令人担忧的是，这些模型在实施违规行为前均能认知到其伦理问...

2025-06-17 talkingdev

Groq的低延迟硬件技术现已正式成为Hugging Face Hub及SDK的可选推理服务提供商，这一合作标志着AI基础设施领域的重大突破。通过集成Groq的专用处理器架构，开发者能够以服务器无感知（serverless）方式极速调用Llama...

2025-05-26 talkingdev

谷歌在2024年I/O开发者大会上悄然推出了Gemma系列的新成员Gemma 3n，这一采用自由权重（free weights）设计的轻量化模型引发了AI社区的广泛关注。作为Gemma家族的最新成员，3n版本在模型架构上进行了显著创新，其技...

2025-05-17 talkingdev

近日，开发者dipampaul17在GitHub上发布了KVSplit项目，该项目通过差异化精度的KV缓存量化技术，在苹果芯片（M1/M2/M3/M4）上实现了更长上下文的LLM推理。研究发现，LLM推理中的KV缓存中，键（Keys）和值（Values）...

2025-05-15 talkingdev

在LlamaCon技术大会上，微软CEO萨提亚·纳德拉与Meta首席执行官共同揭示了人工智能在代码生成领域的重大突破。纳德拉透露，微软目前高达30%的代码由AI自动生成，这一数据标志着软件开发范式正在发生根本性变革。AI特...

2025-05-08 talkingdev

Meta最新推出的AI应用通过引入Discover信息流功能，为用户提供了与AI互动的社交化分享平台。这一创新设计不仅允许用户公开自己与AI的对话内容，还支持其他用户对这些内容进行评论、点赞甚至二次创作，旨在通过社交互...

2025-05-01 talkingdev

Promptrepo团队推出了一款创新工具，旨在让产品团队（而不仅仅是机器学习工程师）能够轻松进行AI模型的微调。OpenAI首席产品官近期分享了微调技术在从客户支持到深度研究等领域的广泛应用，并称其为严肃AI团队的未来...