漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-22 talkingdev

Phi-3技术报告

据报道,Phi-3是最新一代的芯片,由中国科技公司开发。该芯片采用了全新的设计,可以将人工智能的计算速度提高到新的高度。Phi-3芯片的性能在各个方面都有了很大的提升,包括计算速度、功耗和可靠性。据报道,该芯片...

Read More
2024-04-12 talkingdev

JetMoe:性能媲美Meta Llama 2 7B的AI模型,成本仅为10万美元

JetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...

Read More
2024-04-12 talkingdev

PoLoPCAC:高效且适应性强的点云压缩新方法

PoLoPCAC代表了一种新型的无损点云属性压缩方法,它不仅压缩效率高,而且对不同规模和密度的点云数据具有良好的适应性。点云数据作为一种重要的三维数据表示形式,在众多领域如自动驾驶、城市规划、虚拟现实等都有着...

Read More
2024-04-12 talkingdev

Cohere推出Rerank 3模型,助力企业搜索与RAG升级

Cohere公司近日发布了其最新的基础模型——Rerank 3,专为提升企业搜索和检索增强生成(RAG)系统而设计。该模型兼容任何数据库或搜索索引,并且可以轻松插入到任何具有原生搜索功能的旧版应用程序中。仅需一行代码,R...

Read More
2024-04-12 talkingdev

亚马逊CEO看好人工智能革命 同时承诺削减成本

在给股东的年度信中,亚马逊首席执行官安迪·贾西阐述了他对生成性人工智能可能成为公司下一个增长支柱的愿景。该公司已向人工智能初创公司Anthropic投资了40亿美元,并邀请了著名的计算机科学家和人工智能专家吴恩达...

Read More
2024-04-11 talkingdev

Rewriting PyTorch nn in Triton,开创神经网络实验库新篇章

Attorch项目旨在用Python和Triton重新编写PyTorch的nn模块部分代码,创建一个易于修改且性能卓越的神经网络实验库。这一尝试标志着以往成本过高的编写工作现在变得可行。Attorch的设计允许研究人员和开发者轻松进行...

Read More
2024-04-10 talkingdev

英特尔发布Gaudi 3 AI处理器,性能超越英伟达H100

英特尔公司近日宣布推出新一代Gaudi 3 AI处理器,该处理器在性能上实现了重大突破。据官方数据显示,Gaudi 3在训练性能上提升高达1.7倍,推理性能提升50%,同时在效率上也比英伟达的H100处理器高出40%,而成本却更低...

Read More
2024-04-10 talkingdev

SqueezeAttention技术助力LLM优化,内存使用降低30%至70%

近日,开发者社区GitHub上出现了一项名为SqueezeAttention的新技术,该技术针对大型语言模型(LLMs)的键值缓存进行了优化。通过SqueezeAttention,内存使用量能够显著降低30%至70%,同时吞吐量也得到了翻倍提升。这...

Read More
2024-04-08 talkingdev

ReFT:一种高效节省参数的微调语言模型方法

近期在GitHub上发布的ReFT(Representation Fine-Tuning)项目,为微调语言模型带来了一种新的参数高效方法。与传统的PeFT相比,ReFT在保持强大性能的同时,大大降低了成本。该方法通过精细化调整模型参数,使得在进...

Read More
2024-04-05 talkingdev

SableDb:一款旨在降低内存成本、提升容量的键值对NoSQL数据库

SableDb是一款新兴的键值对NoSQL数据库,其设计目标是相较于Redis进一步降低内存成本并提升数据存储容量。该数据库采用了高效的数据结构和算法,优化了内存使用效率,使得在处理大量数据时仍能保持较低的资源消耗。S...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page