漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-21 talkingdev

从零开始构建Llama 3(保姆级教程)

与其说下载语言模型权重并利用各种工具运行它们是一件容易的事,不如说更难的是准确理解代码本身在做什么。这份出色的教程详细展示了如何重建Llama 3并运行训练后的权重的每一个步骤。从安装必要的环境,编写代码,...

Read More
2024-05-17 talkingdev

纯NumPy实现的Llama3模型——Llama3.np

近日,在GitHub上出现了一个新的项目,名为Llama3.np,这是一个纯NumPy实现的Llama 3模型。NumPy是一种使用Python进行科学计算的基础软件包,而Llama 3模型则是一种流行的机器学习模型。Llama3.np 项目旨在提供一种...

Read More
2024-05-16 talkingdev

Nous Hermes发布首款Theta模型,具有出色的函数调用能力

Nous Hermes发布了全新的Theta模型,该模型是Hermes 2 Pro和Llama 3 8B instruct的结合。它具有出色的函数调用能力,并在各种基准测试中表现强劲。Hermes 2 Pro是一款高性能的模型,而Llama 3 8B instruct则以其强大...

Read More
2024-05-15 talkingdev

Ollama在Google Firebase上的新动态

Genkit是一款针对Firebase的新型工具集,专门用于构建和部署生成性产品。Genkit可以用来启动开源语言模型的服务器。Firebase是Google的移动平台,它可以帮助开发者快速开发高质量的应用,增加用户基础,并获取更多的...

Read More
2024-05-14 talkingdev

WebLlama:基于网页浏览并本地问答的开源模型

WebLlama是一个设计精良的模型,能够浏览网页并据此回答相关问题。这种模型可用于生成高质量的预训练数据集,或者执行需要从网页查询信息的研究。WebLlama的目标是通过模型的训练,使其能够更好地理解和处理网络信息...

Read More
2024-05-07 talkingdev

DeepSeek发布200B+参数模型——DeepSeek-V2

DeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2,其中激活参数达到210亿。无论是在编码还是推理方面,该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型,但无疑,...

Read More
2024-05-03 talkingdev

用WebGPU构建免费的浏览器内Llama 3聊天机器人

最近,一位开发者使用WebGPU构建了一个免费的浏览器内Llama 3聊天机器人。Llama 3聊天机器人是一个人工智能聊天机器人,能够回答用户的问题,甚至能够进行基础的对话。与其他聊天机器人不同的是,Llama 3聊天机器人...

Read More
2024-05-01 talkingdev

Meta发布ExecuTorch框架,为边缘设备上的LLM提供支持

Meta发布了一款名为ExecuTorch的框架,这是一个后训练量化工具包,能够支持在各种iPhone和Galaxy设备上运行Llama模型。该框架能够在运行7B大小语言模型的手机上,每秒获取多达11个令牌。ExecuTorch框架的发布,进一...

Read More
2024-04-30 talkingdev

Moondream 2模型驱动的llamafile全功能VLM可执行文件

Moondream 2模型作为一种高效的AI模型,其性能强大且体积小巧,现已发布其全功能的VLM可执行文件,名为llamafile。这款全功能的VLM可执行文件是一种完全自包含的程序,可以在边缘设备上运行。这意味着,即使在没有网...

Read More
2024-04-29 talkingdev

Llama 3在本地完全运行 AI 小镇

AI 小镇是一个可以在本地完全运行的人类交互模拟器。这一技术的关键在于,它可以能在本地运行,而不需要依赖云端服务。用户可以在自己的计算机上模拟出人类的各种互动行为。这一创新技术的出现,为人工智能的发展提...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page