技术的相关内容 - 漫话开发者

2024-03-18 talkingdev

探索LLM推理的“光速”极限

本文深入探讨了基于变换器的语言模型推理的“光速”理论极限，强调了内存带宽相较于计算能力的重要性。文章通过实例展示了推理速度主要受限于从内存中读取数据的能力，而非执行计算的速度，这对于优化和理解AI性能是一...

2024-03-18 talkingdev

本文深入探讨了技术创新对工作的影响历史，将AI的兴起视为最新的例证。文章通过对书写、印刷和打字机等过去的转变与当前的AI革命进行比较，思索AI最终会增强还是削弱人类的创造力。作者呼吁人们在AI生成内容日益增长...

2024-03-18 talkingdev

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台，以优化模型训练的性能和...

2024-03-18 talkingdev

Clarity Upscaler是一款集成了最新人工智能技术的图像放大工具，其GitHub页面已公开。该工具能够将低分辨率图像通过AI算法转换为高清晰度图像，有效改善了图像的放大过程中可能出现的模糊和像素化问题。Clarity Upsc...

2024-03-18 talkingdev

ScoreHMR公司近日推出了一种新颖的3D人体姿态和形状重建方法。该技术利用扩散模型的强大能力，避免了传统优化技术，采用了得分引导方式将人体模型与图像观测数据对齐。这一创新方法不仅提高了重建的准确性，还大大减...

2024-03-18 talkingdev

通过分析GitHub上的星标数，我们可以发现目前最流行的AI模型的一些有趣趋势。大多数开源AI工具集中在基础设施和应用层面。这些工具的开发和使用反映了AI技术在实际应用中的不断进步，以及开发者社区对于高效、便捷AI...

2024-03-18 talkingdev

Anthropic公司最新推出的Claude 3 Haiku AI模型，以其卓越的速度和经济性成为目前市场上最快的AI模型。该模型具备先进的视觉能力，并在各项基准测试中表现突出。Claude 3 Haiku专为企业设计，注重速度和可负担性，为...

2024-03-18 talkingdev

人工智能领域的领先企业xAI近日宣布，已将其拥有3140亿参数的Mixture-of-Experts模型——Grok-1的权重和架构公开。Grok-1采用JAX编写，并融入了现代Transformer架构，包括GeGLU、ROPE、三明治范数等先进技术。此次公开...