LLaMA的相关内容 - 漫话开发者

2024-06-19 talkingdev

FireFunction-v2：匹配GPT4-o功能调用基准的开源模型

FireFunction-v2是一个开放模型，它在功能调用基准上与GPT4-o相匹配，这个模型是在Llama 3 70B的基础上训练出来的。这一模型的开发将为AI领域带来新的突破。FireFunction-v2的性能表现优秀，证明了它在处理大规模数...

2024-06-19 talkingdev

LlamaIndex最近推出了属性图索引，进一步增强了知识图谱的建模、存储和查询功能。新的索引允许灵活的图形构建，支持由模式引导的、隐式的和自由形式的实体提取，并且能够与向量数据库进行整合以实现混合搜索。该索引...

2024-06-07 talkingdev

阿里云最新发布的旗舰语言模型Qwen 2在基准性能测试中略超越了Llama 3 70B，成为新一代语言模型的标杆。Qwen 2不仅在英语性能方面表现卓越，同时也是一个更优秀的多语言模型。这一突破性进展标志着阿里云在人工智能...

2024-06-06 talkingdev

研究人员推出了LlamaCare，一个专门为医疗知识调优的大型语言模型（LLM）。LlamaCare不仅在处理医疗数据方面表现出色，还引入了扩展分类集成（ECI）技术，以解决LLM中的分类问题。该模型的推出标志着医疗领域人工智...

2024-06-04 talkingdev

近期，Ollama和Continue通过一系列开源模型的强大改进，实现了完全在设备上运行的自动补全和聊天功能。这一突破意味着开发者无需依赖云服务即可进行高效的代码编写和调试，显著提升了编程的安全性和隐私性。Ollama和...

2024-05-31 talkingdev

Yuan 2.0-M32是一款具备40亿参数的专家混合模型，其中任意时刻仅有3.7亿参数处于激活状态。尽管其计算需求仅为Llama 3 70B的1/19，但其性能却接近后者。该模型在2万亿个token上进行了训练，展现出了令人惊讶的强大性...

2024-05-28 talkingdev

近日，计算机科学家们推出了一款名为Llama 3-V的新型人工智能模型，其与GPT4-V性能相当，但模型大小只有GPT4-V的1/100。与GPT4-V的高昂价格相比，Llama 3-V仅需500美元即可获得。这款新型模型可以应用于自然语言处理...

2024-05-24 talkingdev

Llama cpp现已支持跨多台机器的分布式推理。这一功能目前仅限于FP16（半精度浮点数），但对于开源部署来说，这无疑是一个巨大的进步。通过分布式推理，开发者可以更高效地利用集群资源，提升模型推理的速度和效率。...