漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-03 talkingdev

大型语言模型系统与产品的设计模式

本文讨论了将大型语言模型集成到系统和产品中的实用模式。它结合了学术研究、行业资源和从业者的专业知识。本文介绍了七种关键模式,涵盖了提高性能与降低成本/风险以及更接近数据与更接近用户之间的一系列模式。

Read More
2023-08-02 talkingdev

论文:ToolLlama-语言模型与API的强大结合

工具使用是一个范例,其中语言模型生成触发某些API被调用的词汇,其输出作为令牌被反馈到语言模型中。这意味着语言模型能够使用计算器,网络浏览器,甚至编码环境。随着最近强大的开源语言模型的发布,您可以收集40k...

Read More
2023-08-02 talkingdev

PromptTools:自托管工具用于评估LLM和向量数据库

PromptTools是一套自托管工具,用于实验、测试和评估大型语言模型、向量数据库和提示。它允许开发者使用代码、笔记本和本地沙盒进行评估。开发者只需几行代码就可以测试不同模型上的提示和参数。PromptTools可以用于...

Read More
2023-08-01 talkingdev

占星术与AI的完美结合 - Aistro产品发布

Aistro将古老的占星术智慧与现代大型语言模型AI的力量完美结合!Aistro应用让你询问关于你的星座,个性或未来的任何问题。只需输入你的出生日期,时间和地点,就可以获得个性化的阅读体验。这是一次人工智能技术与传...

Read More
2023-08-01 talkingdev

论文:利用大型语言模型提升交通安全性

尽管大型语言模型(LLMs)在众多自然语言处理任务中取得了成功,但在交通安全领域却显得力不从心,因为这需要专门的知识。为解决这个问题,研究人员开发了TrafficSafetyGPT,这是一个经过独特数据集微调的LLM模型。...

Read More
2023-08-01 talkingdev

Ollama开源:运行、创建和分享大型语言模型

Ollama是一个发布在GitHub上的项目,专为运行、创建和分享大型语言模型而设计。它为开发者和研究者提供了一个集成的平台,可以方便的搭建、训练并分享他们的语言模型。这些模型可以应用于各种语言处理任务,如机器翻...

Read More
2023-07-31 talkingdev

优化后的Llama 2,上下文长度达到32k

最近获得2000万美元投资的together公司,已经对Llama 2进行了微调,通过在位置嵌入上进行线性扩展,使其在处理上下文时可以处理高达32k的token。他们在许多有趣的基准测试中进行了测试,但是他们警告说,现代语言模...

Read More
2023-07-27 talkingdev

GPT-4的性能是否随着时间的推移而下降?

最近一篇文献提出,GPT-4的性能降级问题已引起争议,人们将其性能下降归因于微调引起的行为改变,而非能力的丧失。这项研究强调了由于这些微调差异而导致量化评估语言模型的挑战性。虽然有研究暗示GPT-4性能出现退化...

Read More
  1. Prev Page
  2. 144
  3. 145
  4. 146
  5. Next Page