FrugalGPT是一套可以大幅度降低LLM API成本的策略。这些策略包括提示压缩、缓存等操作。提示压缩可以通过减少数据大小来降低传输和存储成本,同时也可以提高数据处理速度。而缓存则可以通过存储经常访问的数据来减少...
Read MoreJetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...
Read MorePoLoPCAC代表了一种新型的无损点云属性压缩方法,它不仅压缩效率高,而且对不同规模和密度的点云数据具有良好的适应性。点云数据作为一种重要的三维数据表示形式,在众多领域如自动驾驶、城市规划、虚拟现实等都有着...
Read MoreCohere公司近日发布了其最新的基础模型——Rerank 3,专为提升企业搜索和检索增强生成(RAG)系统而设计。该模型兼容任何数据库或搜索索引,并且可以轻松插入到任何具有原生搜索功能的旧版应用程序中。仅需一行代码,R...
Read More在给股东的年度信中,亚马逊首席执行官安迪·贾西阐述了他对生成性人工智能可能成为公司下一个增长支柱的愿景。该公司已向人工智能初创公司Anthropic投资了40亿美元,并邀请了著名的计算机科学家和人工智能专家吴恩达...
Read MoreAttorch项目旨在用Python和Triton重新编写PyTorch的nn模块部分代码,创建一个易于修改且性能卓越的神经网络实验库。这一尝试标志着以往成本过高的编写工作现在变得可行。Attorch的设计允许研究人员和开发者轻松进行...
Read More英特尔公司近日宣布推出新一代Gaudi 3 AI处理器,该处理器在性能上实现了重大突破。据官方数据显示,Gaudi 3在训练性能上提升高达1.7倍,推理性能提升50%,同时在效率上也比英伟达的H100处理器高出40%,而成本却更低...
Read More