漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-15 talkingdev

如何选择并获取最适合的GPU?

随着越来越多的云服务提供商为AI工作负载提供微调或服务,人们往往很难决定选择哪一个。这里提供了一套相当不错的启发式规则,帮助您决定在哪个云上运行您的任务。在选择云服务提供商时,您应首先考虑您的具体需求,...

Read More
2023-08-11 talkingdev

论文:通过在上下文中学习提升Llama-2模型的性能

在一篇新的研究报告中,研究人员在聊天式提示中通过检索9个演示示例,使用预训练的Llama-2语言模型进行了在上下文中的学习。这种方法并没有改变模型的权重,但它使得与文本达芬奇-003模型相比,赢率增加了7倍,使其...

Read More
2023-08-09 talkingdev

HuggingFace联手AWS和Nvidia云,一键进行模型训练

近日,知名开源人工智能库HuggingFace宣布与AWS和Nvidia展开合作,为平台带来一键式训练功能。用户只需上传数据,即可直接在hub上对先进的模型进行微调。这一创新举措无疑将为AI研究者和开发者提供极大的便利,不再...

Read More
2023-08-02 talkingdev

论文:ToolLlama-语言模型与API的强大结合

工具使用是一个范例,其中语言模型生成触发某些API被调用的词汇,其输出作为令牌被反馈到语言模型中。这意味着语言模型能够使用计算器,网络浏览器,甚至编码环境。随着最近强大的开源语言模型的发布,您可以收集40k...

Read More
2023-08-01 talkingdev

论文:利用大型语言模型提升交通安全性

尽管大型语言模型(LLMs)在众多自然语言处理任务中取得了成功,但在交通安全领域却显得力不从心,因为这需要专门的知识。为解决这个问题,研究人员开发了TrafficSafetyGPT,这是一个经过独特数据集微调的LLM模型。...

Read More
2023-07-31 talkingdev

优化后的Llama 2,上下文长度达到32k

最近获得2000万美元投资的together公司,已经对Llama 2进行了微调,通过在位置嵌入上进行线性扩展,使其在处理上下文时可以处理高达32k的token。他们在许多有趣的基准测试中进行了测试,但是他们警告说,现代语言模...

Read More
2023-07-28 talkingdev

稳定性AI发布最新文本到图像模型:稳定扩散XL 1.0

稳定性AI近期发布了最新的先进文本到图像模型,稳定扩散XL (SDXL) 1.0,该模型已在亚马逊Bedrock,以及其自有API上提供。新模型提供了改进的颜色准确性和细节,并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....

Read More
2023-07-27 talkingdev

GPT-4的性能是否随着时间的推移而下降?

最近一篇文献提出,GPT-4的性能降级问题已引起争议,人们将其性能下降归因于微调引起的行为改变,而非能力的丧失。这项研究强调了由于这些微调差异而导致量化评估语言模型的挑战性。虽然有研究暗示GPT-4性能出现退化...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page