微调的相关内容 - 漫话开发者

2024-10-27 talkingdev

利用LLM提升测试实践的创新探索

随着人工智能技术的迅猛发展，LLM（大语言模型）在各个领域的应用持续扩展，尤其在软件测试领域显示出巨大的潜力。通过使用LLM，测试团队能够自动生成测试用例、提升代码覆盖率，并通过智能分析加快缺陷检测的速度。...

2024-09-27 talkingdev

Together AI推出了Llama 3.2版本，用户可以在Together Playground上免费体验这一全新多模态模型。该模型在训练、微调和推理方面支持200多个模型，包括最新的Llama 3.2视觉模型。Llama 3.2在生产规模下实现了4倍的速...

2024-09-24 talkingdev

近日，研究团队成功在AMD GPU上对Llama 405B进行了微调。这一进展不仅提升了模型的性能，也展示了AMD硬件在深度学习领域的潜力。通过针对特定任务的微调，Llama 405B在处理复杂自然语言处理任务时表现出色，证明了其...

2024-09-21 talkingdev

MemoRAG是一种新兴的技术，旨在通过记忆驱动的知识发现，提升RAG在处理长文本方面的能力。传统的RAG模型在面对长文本时，往往会因为信息量过大而导致性能下降。MemoRAG通过引入记忆机制，有效地存储和检索关键信息，...

2024-07-19 talkingdev

E5-V是一种新的框架，其改编了多模态大型语言模型（MLLMs）以创建全球多模态嵌入。通过使用提示，它弥补了不同输入类型之间的差距，而无需进行微调就实现了在多模态任务中的令人印象深刻的性能。这一全球多模态嵌入...

2024-07-11 talkingdev

Anole是一款基于Meta的Chameleon模型构建的开放自回归多模态模型。近期，研究者们着重对该模型进行了微调，成功地将图像生成能力重新整合进了模型中。这一改进不仅提高了模型的功能性，也为未来的开发打开了新的可能...

2024-06-26 talkingdev

近日，AI与Morph Labs联合发布了一篇关于信息检索增强型生成（RAG）模型微调的优秀博客文章。在文章中，他们展示了一些合成数据的使用情况。信息检索增强型生成模型是一种新型的深度学习模型，它结合了信息检索技术...

2024-06-19 talkingdev

在MLPerf的两项新测试中，由Nvidia的Hopper架构驱动的系统表现突出，这两项测试分别比较了大型语言模型的微调和图神经网络的训练。MLPerf是一个AI基准测试套件，用于比较不同系统在AI任务上的性能。Nvidia的Hopper架...