模型的相关内容 - 漫话开发者

2024-04-15 talkingdev

谷歌发布新一代AI芯片，挑战Nvidia、微软和亚马逊

谷歌宣布其最新的人工智能芯片Cloud TPU v5p现已问世。这款芯片的训练速度是前代TPU v4的近三倍，尤其在大型语言模型的训练上表现出色。这一发布进一步巩固了谷歌在AI硬件领域与其他竞争对手如Nvidia的竞争优势。同...

2024-04-15 talkingdev

xAI公司近日宣布，其最新旗舰模型Grok-1.5已具备视觉功能，与现有最先进模型相比肩，甚至在某些方面超越。Grok-1.5的推出，标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...

2024-04-15 talkingdev

本文总结了专注于文本处理的初创公司Truss在过去六个月内发布数个基于大型语言模型（LLM）的功能中获得的七项宝贵经验。这些经验涵盖了如何改进提示方式、工具使用、GPT技术的最佳实践、以及GPT的局限性等方面。Trus...

2024-04-12 talkingdev

JetMoe是一个基于混合专家模型的新AI系统，通过使用公共数据集和合理的计算资源进行训练，其性能与Meta的Llama 2 7B模型相媲美，但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...

2024-04-12 talkingdev

SplatPose提出了一种新颖的3D高斯喷溅方法，有效解决了不同姿态下3D物体异常检测的难题。该技术通过模拟光线在物体表面的散射过程，实现了对物体表面细节的精确捕捉。即使在物体姿态多变的情况下，也能够准确地识别...

2024-04-12 talkingdev

近期一项研究深入探讨了大型语言模型中不同概念的理解方式。该研究发现，在这些模型中，简单任务通常由较浅的层次处理，而更复杂的任务则需要更深层次的处理能力。这一发现有助于我们更好地理解人工智能在处理信息时...

2024-04-12 talkingdev

InstantMesh项目近日亮相，该框架能够从单张图片中瞬间生成3D网格模型，其生成的模型质量与可扩展性均处于行业领先水平。该技术的出现极大地简化了3D建模过程，为游戏开发、虚拟现实、增强现实等领域带来前所未有的...

2024-04-12 talkingdev

Mistral公司近日发布了一款新型的8x22B模型，并通过磁力链接供用户下载体验。根据社区首批基准测试结果显示，该模型作为基础模型表现突出，其77 MMLU（与推理能力密切相关的指标）得分令人瞩目。这一新模型的出现，...