JetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...
Read More英特尔公司近日宣布推出新一代Gaudi 3 AI处理器,该处理器在性能上实现了重大突破。据官方数据显示,Gaudi 3在训练性能上提升高达1.7倍,推理性能提升50%,同时在效率上也比英伟达的H100处理器高出40%,而成本却更低...
Read MoreGarnet是一个远程缓存存储系统,具备卓越的性能、可扩展性、存储恢复能力、集群分片、键迁移和复制功能。该技术与现有的Redis客户端兼容,能够处理多键事务。Garnet拥有快速的可插拔网络设计,确保了端到端的高性能...
Read More本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台,以优化模型训练的性能和...
Read MoreAnthropic公司最新推出的Claude 3 Haiku AI模型,以其卓越的速度和经济性成为目前市场上最快的AI模型。该模型具备先进的视觉能力,并在各项基准测试中表现突出。Claude 3 Haiku专为企业设计,注重速度和可负担性,为...
Read MoreVisual Speech Recognition with Language Models(VSP-LLM)框架在视觉语音识别和翻译中引入了新的方法,通过集成LLMs来高效处理视频输入,通过去重嵌入视觉特征和使用低秩适配器进行成本效益训练。
Read More麻省理工学院和IBM的研究人员发表了一篇名为《超越AI接触:哪些任务具有计算机视觉自动化的成本效益?》的工作论文,探讨了自动化基于视觉的任务的经济可行性。该论文发现,仅有23%的任务适合自动化。与更具破坏性...
Read MoreDataiku近日发布了LLM Mesh,以解决在企业中集成LLM的有效、可扩展、安全平台的紧迫需求。LLM Mesh位于LLM服务提供商和最终用户应用之间,公司可以根据自己的需求选择最具成本效益的模型,以确保其数据和响应的安全...
Read More