漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-29 talkingdev

FrugalGPT:有效降低LLM API成本的策略

FrugalGPT是一套可以大幅度降低LLM API成本的策略。这些策略包括提示压缩、缓存等操作。提示压缩可以通过减少数据大小来降低传输和存储成本,同时也可以提高数据处理速度。而缓存则可以通过存储经常访问的数据来减少...

Read More
2024-04-22 talkingdev

Phi-3技术报告

据报道,Phi-3是最新一代的芯片,由中国科技公司开发。该芯片采用了全新的设计,可以将人工智能的计算速度提高到新的高度。Phi-3芯片的性能在各个方面都有了很大的提升,包括计算速度、功耗和可靠性。据报道,该芯片...

Read More
2024-04-12 talkingdev

JetMoe:性能媲美Meta Llama 2 7B的AI模型,成本仅为10万美元

JetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...

Read More
2024-04-12 talkingdev

PoLoPCAC:高效且适应性强的点云压缩新方法

PoLoPCAC代表了一种新型的无损点云属性压缩方法,它不仅压缩效率高,而且对不同规模和密度的点云数据具有良好的适应性。点云数据作为一种重要的三维数据表示形式,在众多领域如自动驾驶、城市规划、虚拟现实等都有着...

Read More
2024-04-12 talkingdev

Cohere推出Rerank 3模型,助力企业搜索与RAG升级

Cohere公司近日发布了其最新的基础模型——Rerank 3,专为提升企业搜索和检索增强生成(RAG)系统而设计。该模型兼容任何数据库或搜索索引,并且可以轻松插入到任何具有原生搜索功能的旧版应用程序中。仅需一行代码,R...

Read More
2024-04-12 talkingdev

亚马逊CEO看好人工智能革命 同时承诺削减成本

在给股东的年度信中,亚马逊首席执行官安迪·贾西阐述了他对生成性人工智能可能成为公司下一个增长支柱的愿景。该公司已向人工智能初创公司Anthropic投资了40亿美元,并邀请了著名的计算机科学家和人工智能专家吴恩达...

Read More
2024-04-11 talkingdev

Rewriting PyTorch nn in Triton,开创神经网络实验库新篇章

Attorch项目旨在用Python和Triton重新编写PyTorch的nn模块部分代码,创建一个易于修改且性能卓越的神经网络实验库。这一尝试标志着以往成本过高的编写工作现在变得可行。Attorch的设计允许研究人员和开发者轻松进行...

Read More
2024-04-10 talkingdev

英特尔发布Gaudi 3 AI处理器,性能超越英伟达H100

英特尔公司近日宣布推出新一代Gaudi 3 AI处理器,该处理器在性能上实现了重大突破。据官方数据显示,Gaudi 3在训练性能上提升高达1.7倍,推理性能提升50%,同时在效率上也比英伟达的H100处理器高出40%,而成本却更低...

Read More
  1. Prev Page
  2. 26
  3. 27
  4. 28
  5. Next Page