模型的相关内容 - 漫话开发者

2024-05-20 talkingdev

让LoRA学习更少遗忘更少，优化模型微调调优的新方法

LoRA（Learning of Rate Adjustor）是一种被广泛应用于模型微调的方法，用于注入风格或知识。近期的一篇研究论文深入探讨了在使用LoRA时，学习能力和遗忘之间的权衡关系。研究发现，LoRA相比于全面微调，虽然学习的...

2024-05-20 talkingdev

xAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型，拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点，这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...

2024-05-17 talkingdev

在技术领域，一种名为MasterWeaver的新方法被提出，以提高个性化文本到图像生成模型的性能。这种技术的出现，无疑为AI领域的图像生成技术开辟了新的可能性，使得文本到图像的转换过程更为精确和个性化。MasterWeaver...

2024-05-17 talkingdev

研究人员已经开发出一种新的技术，可以填补3D LiDAR扫描中的空白，使得自动驾驶汽车能够更好地理解周围的环境。这种技术通过使用先进的算法和数据处理技术，将不完整的3D视图转换成完整的视野，提供了一个更准确的环...

2024-05-17 talkingdev

近日，在GitHub上出现了一个新的项目，名为Llama3.np，这是一个纯NumPy实现的Llama 3模型。NumPy是一种使用Python进行科学计算的基础软件包，而Llama 3模型则是一种流行的机器学习模型。Llama3.np 项目旨在提供一种...

2024-05-17 talkingdev

Xmodel-VLM是一种针对消费级GPU服务器优化的视觉语言模型。为解决高昂的服务成本限制了大规模多模态系统的应用，这个10亿规模的模型采用了LLaVA范式进行模态对齐。这是一种新的方法，它优化了视觉和语言之间的协同工...

2024-05-16 talkingdev

OpenAI的GPT商店现已对所有用户开放，用户可以自由浏览和使用。OpenAI的GPT商店提供了一系列的GPT模型以供选择，包括GPT-3、GPT-2等。这些模型已被广泛应用于各种人工智能应用中，如聊天机器人、文本生成、自然语言...

2024-05-16 talkingdev

Hopfield Boosting是一种技术，该技术利用现代Hopfield能量来增强在机器学习模型中对分布外（OOD）数据的检测。在机器学习中，处理OOD数据一直是一项挑战，因为这些数据往往不符合模型的预期分布。通过Hopfield Boos...