漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-30 talkingdev

Moondream 2模型驱动的llamafile全功能VLM可执行文件

Moondream 2模型作为一种高效的AI模型,其性能强大且体积小巧,现已发布其全功能的VLM可执行文件,名为llamafile。这款全功能的VLM可执行文件是一种完全自包含的程序,可以在边缘设备上运行。这意味着,即使在没有网...

Read More
2024-04-30 talkingdev

Memary开源:长记忆Agent开启大规模知识图谱存储新篇章

近日,GitHub上出现了一个名为Memary的新项目。该项目允许Agent在知识图谱中存储大量信息,通过我们的记忆模块推断用户知识,只检索与结果相关的信息。Memary的核心是其强大的知识图谱,这是一种可以存储和组织大量...

Read More
2024-04-30 talkingdev

Mistral.rs:一款快速的LLM开源推理平台

近日,一款名为Mistral.rs的LLM推理平台在GitHub上备受关注。它可以支持多种设备上的推理,支持量化,并且具有易于使用的应用程序,带有OpenAI API兼容的HTTP服务器和Python绑定。无论是在深度学习推理、设备兼容性...

Read More
2024-04-30 talkingdev

论文:以FP6-LLM新装包格式加速训练,实现全张量核心利用

浮点精度的降低能够提高训练速度,但可能会导致不稳定的现象。最新的研究论文展示,通过新的装包格式FP6-LLM,可以在不引发常见不稳定性或由于尝试不当引发的训练速度下降的情况下,实现全张量核心的利用。这一突破...

Read More
2024-04-30 talkingdev

GitHub发布新项目Copilot Workspace,让语言模型帮助完成功能和修复错误

GitHub近日宣布启动一个新项目Copilot Workspace,其主要目标是允许语言模型以较为自主的方式完成特性开发和错误修复。该项目将为开发者提供更多便利,提高开发效率,同时也为人工智能在软件开发领域的应用开启了新...

Read More
2024-04-30 talkingdev

Dokploy:开源版Vercel,应用云托管PaaS平台

Dokploy是一个免费的、可自我托管的平台即服务(PaaS)解决方案。它简化了应用程序和数据库的部署和管理。Dokploy允许开发者在任意的虚拟私有服务器(VPS)上高效、安全地部署应用程序。其主要特性包括整合Traefik,...

Read More
2024-04-29 talkingdev

AIFLash-AI助力记忆卡片的创新产品发布

AI记忆卡片是一种革新性的记忆工具,它可以从任何文本或文件中创建个性化的闪卡,为学习提供新的可能性。我们的AI技术能够理解文本内容,将其转化为可供学习的记忆卡片。这些记忆卡片可用于复习、记忆新知识点,有助...

Read More
2024-04-29 talkingdev

FrugalGPT:有效降低LLM API成本的策略

FrugalGPT是一套可以大幅度降低LLM API成本的策略。这些策略包括提示压缩、缓存等操作。提示压缩可以通过减少数据大小来降低传输和存储成本,同时也可以提高数据处理速度。而缓存则可以通过存储经常访问的数据来减少...

Read More
  1. Prev Page
  2. 105
  3. 106
  4. 107
  5. Next Page