漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-10 talkingdev

谷歌Gemma扩展模型提升性能与效率

谷歌近期成功训练了一套名为Gemma的代码模型和循环Gemma模型。这些新模型展现出了与现有技术相媲美的性能,并且已经集成了FIM(查找插入记忆)功能。值得注意的是,循环Gemma模型在运行速度和内存效率方面都有显著提...

Read More
2024-04-02 talkingdev

英伟达TensorRT更新,性能提升达28倍,Llama 2基准测试每秒处理1200个令牌

英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新,这一更新使得AI推理速度大幅提高,达到了比基线快28倍的速度。特别是在Llama 2的基准测试中,能够达到每秒处理1200个令牌的惊人速度。这一进步得益...

Read More
2024-03-28 talkingdev

二进制搜索向量技术助力RAG管道性能提升

在RAG(检索-生成)管道中,对嵌入向量进行搜索是至关重要的一环。通过将fp32数字替换为单个0或1,并使用KNN聚类器和重排序器,可以在缩小内存需求30倍的同时,保持性能不受影响。这一技术突破为处理大规模数据集提...

Read More
2024-03-22 talkingdev

GPT-4微调体验:性能提升三倍,成本增加50%

近期,OpenAI推出了GPT-4的微调API,使用户能够创建一个定制版本的GPT-4。这一服务的优势在于,用户可以根据自己的特定需求调整模型,从而在性能上获得高达三倍的提升。不过,这一性能提升并非没有代价,相比于原版G...

Read More
2024-03-20 talkingdev

人工智能发展遇瓶颈?GPT-4等大型语言模型显现收益递减

近期研究表明,人工通用智能(AGI)的发展可能并未如预期那般顺利。尽管投入了更多的资源,像GPT-4这样的大型语言模型(LLMs)却表现出硬件扩展的极限,收益递减的现象。这意味着,随着模型规模的扩大,其性能提升的...

Read More
2024-03-11 talkingdev

谷歌推出 Tensor G4 芯片,将与骁龙 8 代 4 和苹果 A18 Pro 竞争

谷歌即将推出的 Pixel 9 将搭载 Tensor G4 芯片,该芯片设计用于更好的散热和电源管理。虽然 G4 提供了适度的性能提升,但 G5 芯片预计将进一步提高 Pixel 10 系列的硬件和软件整合。

Read More
2024-02-09 talkingdev

MobileVLM,为移动设备量身打造的先进视觉语言模型

MobileVLM V2是一系列为移动设备量身打造的先进视觉语言模型,通过创新的架构展示了显著的性能提升。新的MobileVLM V2拥有更快的推理速度,更高的准确性和更广泛的应用场景。MobileVLM V2不仅支持图像和文本之间的交...

Read More
2024-02-08 talkingdev

jQuery 4.0.0 Beta发布:支持性能提升、去除对IE<11的支持等更新

jQuery 4.0.0 beta版发布,该版本特性包括修复了一些bug,提升了性能,并有一些重大改变,比如去除了对IE<11的支持。其他重大变更包括已弃用API的删除,公共函数的内部参数和一些过于复杂的魔法行为的支持。在正式发...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page