漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-02 talkingdev

Ollama:让本地LLM模型运行变得简单

随着越来越多的新模型问世,寻找一种能够轻松拉取并运行这些模型的方法变得具有挑战性。而且,重新混合和制作这些模型也不是一件容易的事情。然而,这款名为Ollama的小工具让测试最新模型变得简单。这款工具具有用户...

Read More
2023-09-08 talkingdev

技术巨头Adept AI发布开源LLM及推理模型

原名为Adept的柿子科技公司,近期推出了其极其高效的8b参数模型——柿子-8B。同时,该公司也发布了推理代码。此次发布的模型和代码中包含了许多亮点,其中最引人注目的是具备70k未使用的嵌入功能,这为多模态扩展提供...

Read More
2023-08-29 talkingdev

Lagent:轻量级构建LLM Agent的框架

Lagent是一个轻量级框架,专门用于构建基于LLM(Logical Layered Modeling)的代理。这种框架的设计目的是为了简化和提高基于这种模型的代理的开发效率。LLM模型是一种强大的工具,可以用于模拟和管理复杂的系统,而...

Read More
2023-08-10 talkingdev

Anthropic推出改进版入门级LLM模型:Claude Instant

Anthropic近日发布了更新版本的快速、经济的文本生成模型Claude Instant。此模型能生成更长、结构更严谨的回复,更好地遵循格式指示,并在引用提取、多语种能力和问答方面表现出改善。Claude Instant已通过API可供使...

Read More
2023-08-01 talkingdev

论文:利用大型语言模型提升交通安全性

尽管大型语言模型(LLMs)在众多自然语言处理任务中取得了成功,但在交通安全领域却显得力不从心,因为这需要专门的知识。为解决这个问题,研究人员开发了TrafficSafetyGPT,这是一个经过独特数据集微调的LLM模型。...

Read More
2023-06-30 talkingdev

Boba AI-如何构建基于LLM的生成应用程序

这是一个有趣的案例研究,介绍了如何构建一个基于LLM技术的生成应用程序。在这个案例中,开发团队使用了先进的自然语言处理技术,通过训练模型来生成波霸奶茶相关的内容。他们通过收集大量的波霸奶茶相关数据,并使...

Read More
2023-06-01 talkingdev

竞相研发更小的人工智能

近日,BabyLM挑战赛成为了一项旨在开发更小但仍然有效的人工智能模型的举措。由于大型LLM模型的缺点,如更大的模型需要处理能力,而只有少数公司拥有这种能力,因此推动开发更小的AI模型已经成为了当前的趋势。 ###...

Read More
2023-05-01 talkingdev

Lamini:快速定制模型的LLM引擎

Lamini是一款用于快速定制模型的LLM引擎。这个GitHub仓库包含一个7.1万条指令的数据集,用于微调指令跟随的LLM模型,Lamini的数据生成器和微调后的LLM模型。所有数据和LLM都具有商业使用许可。 以下是该新闻的三个...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3