学习的相关内容 - 漫话开发者

2024-05-30 talkingdev

如何构建大型语言模型产品：一年的实践和深刻洞察

随着人工智能产品的门槛降低，从演示到实现有效产品的转变依然充满挑战。这一系列文章将深入探讨过去一年中基于机器学习系统之上开发实际应用的人们，从大型语言模型（LLMs）产品开发中学到的关键教训和方法论。内容...

2024-05-30 talkingdev

Mistral是一家专注于开发人工智能技术的创业公司，最近推出了Codestral，这是一种全新的代码模型。Codestral使用深度学习技术，能够对代码进行理解和分析。与传统的代码分析工具不同，Codestral不仅可以识别代码的语...

2024-05-29 talkingdev

深度学习框架Tinygrad 0.9.0正式发布。Tinygrad是一个轻量级的深度学习框架，支持Python和JavaScript。Tinygrad 0.9.0增加了对自定义函数的支持，以及其他一些性能和稳定性的改进。它的设计使其非常适合在边缘设备上...

2024-05-29 talkingdev

近日，计算机科学家们推出了一款名为Llama 3-V的新型人工智能模型，其与GPT4-V性能相当，但模型大小只有GPT4-V的1/100。与GPT4-V的高昂价格相比，Llama 3-V仅需500美元即可获得。这款新型模型可以应用于自然语言处理...

2024-05-28 talkingdev

一种新的语义和空间适应性（SSA）分类器被引入，以解决语义分割中的局限性。这种创新方法利用粗糙的掩码来指导原型的调整，从而增强细粒度识别并明确掩码边界。SSA分类器通过结合语义和空间信息，使得模型在处理复杂...

2024-05-28 talkingdev

Scribble2Scene是一种针对语义场景补全的新方法，显著减少了对繁琐标注的需求。传统的3D场景补全技术通常需要大量的数据标注，这不仅耗时费力，而且成本高昂。然而，Scribble2Scene通过利用简单的涂鸦和稀疏的标注就...

2024-05-27 talkingdev

模块化范数是一种全新的神经网络权重更新归一化方法，能够高效扩展不同规模网络的训练。这种方法通过调整网络的权重更新过程，确保在各种网络规模下都能保持高效的训练速度和准确性。与传统的归一化方法相比，模块化...

2024-05-27 talkingdev

LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配（LoRA）的应用，通过隐式集成实现了在不增加传统集成方法高计算成本的情况下，仍能做出准确且校准良好的预测。这种方法不仅在精...