漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-16 talkingdev

Anyscale-将Llama 2的冷启动时间缩短至30秒

将模型从云存储加载到节点GPU通常需要大部分推理时间。通过一些巧妙的技巧,例如内存流,Anyscale将其缩短了20倍,仅需30秒即可到达Llama 2 70B。

Read More
2023-10-12 talkingdev

我希望有人早点告诉我如何配置VSCode

本文包含一系列关于VS Code优化的列表,这些优化能帮助开发者简化工作流程。例如,全局隐藏.vscode文件夹、在工作区级别启用格式化器和linter扩展,以及使用内置的终端等。文章的末尾还提供了更多VS Code技巧和窍门...

Read More
2023-10-11 talkingdev

在竞争激烈的拍卖世界中测试大型语言模型

研究员们创造了一款名为AucArena的模拟平台,旨在在拍卖环境中测试大型语言模型。这些环境是动态的,需要策略性思考。初步测试显示,如果给出合适的提示,这些模型可以在拍卖中表现出色,表现出诸如预算和长期计划等...

Read More
2023-09-25 talkingdev

提升嵌入式查询速度的智能技巧(Jupyter Notebook)

检索是一种提高生成质量的方法。然而,嵌入查询和搜索往往较慢。本笔记本展示了一些巧妙的技巧,可以帮助提高检索性能。检索过程中的问题主要集中在嵌入查询和搜索上,这个过程往往效率低下。为了解决这个问题,我们...

Read More
2023-09-15 talkingdev

构建基于RAG的LLM应用程序的全面指南

最近发布的GitHub仓库为开发者提供了一份详尽的指南,指导如何构建基于RAG(Retrieval Augmented Generation)的LLM(Language Learning Machine)应用程序。该指南详细介绍了从设计到实施的全过程,包括选择合适的...

Read More
2023-08-31 talkingdev

Big Tech工程师如何实现最大影响力?三个关键技巧揭示!

最近一条有关在FAANG公司工作多年但成果有限的推文引发了热议,讨论的焦点是在Big Tech公司是否能够产生实质性影响。本文介绍了在任何公司实现影响力的三个策略,涵盖了Big Tech工程师的实际工作内容以及在Big Tech...

Read More
2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

Read More
2023-08-14 talkingdev

信息革命将为智能带来巨大变革

信息革命将会像工业革命一样,为能源带来了变革。大部分工作过去是由肌肉完成的,现在已经不是了-很快,大部分思考也将不再由大脑完成。这种变革不会一夜之间发生,但已经开始了。更多的智能将带来新的技巧,但这些...

Read More
2023-08-01 talkingdev

当GPT-3.5的成本低于Llama 2时

训练吞吐量、提示处理吞吐量和生成吞吐量都有不同的成本,并且受到不同计算资源的瓶颈制约。因此,某些工作负载在Llama 70B上实际上比支付GPT-3.5更昂贵。这篇博客写得非常优雅,围绕模型部署考虑问题有一些非常好的...

Read More
2023-07-28 talkingdev

ReliableGPT:实现OpenAI模型的高可用性

OpenAI模型通常会有一些运行中断或服务不稳定的问题。对于这一问题,GitHub上的一个名为ReliableGPT的仓库给出了解决方法。通过一些巧妙的技巧,该仓库的开发者成功地从OpenAI的API中实现了极高的运行时长。这对于需...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page