漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-16 talkingdev

AI技术难以构建行业壁垒

人工智能(AI)的差异化挑战日益凸显。然而,真正的关键在于不是使用像大型语言模型(LLMs)这样的AI模型,因为这些模型正在变得商品化,而是在于输入这些模型的独特数据。有效的数据工程至关重要,因为它直接影响AI的表...

Read More
2024-04-15 talkingdev

Gemma和Siglip推出VLLM,利用LAION和LLaVA数据集进行训练

Gemma和Siglip最近发布了一款小型但功能强大的视觉语言模型(VLLM),该模型专为理解和生成与图像相关联的语言而设计。VLLM利用大规模的LAION和LLaVA数据集进行训练,这些数据集包含了大量的图像和相关文本信息,使...

Read More
2024-04-15 talkingdev

Jina AI阅读器开源:将网页转换为LLM友好的Markdown格式

Jina AI最新推出了一款名为'LLM friendly HTML conversion'的GitHub项目,该项目旨在将网络链接转换为适用于大型语言模型(LLM)的友好Markdown格式。这一工具的开发,将极大地便利开发者和研究者利用LLM进行各种任...

Read More
2024-04-15 talkingdev

初创公司Truss分享使用GPT技术的七大经验教训

本文总结了专注于文本处理的初创公司Truss在过去六个月内发布数个基于大型语言模型(LLM)的功能中获得的七项宝贵经验。这些经验涵盖了如何改进提示方式、工具使用、GPT技术的最佳实践、以及GPT的局限性等方面。Trus...

Read More
2024-04-10 talkingdev

苹果新AI模型助力Siri理解iOS应用界面

苹果公司开发了一款名为Ferret-UI的多模态大型语言模型(LLM),该模型具备理解移动设备用户界面的能力,有望让Siri更有效地理解并与屏幕上的元素进行互动。Ferret-UI的出现预示着Siri将能够更加直观地与iOS应用进行...

Read More
2024-04-10 talkingdev

SqueezeAttention技术助力LLM优化,内存使用降低30%至70%

近日,开发者社区GitHub上出现了一项名为SqueezeAttention的新技术,该技术针对大型语言模型(LLMs)的键值缓存进行了优化。通过SqueezeAttention,内存使用量能够显著降低30%至70%,同时吞吐量也得到了翻倍提升。这...

Read More
2024-04-09 talkingdev

FlyFlow开源:API中间件助力优化LLM应用

FlyFlow是一个专为优化基于大型语言模型(LLM)的应用程序而设计的API中间件。该中间件通过简化API调用流程,提高数据传输效率,使得开发者能够更加便捷地构建和维护基于LLM的应用程序。FlyFlow支持自动化的错误处理...

Read More
2024-04-09 talkingdev

AIOS:为操作系统注入'大脑'的LLM Agent

AIOS是一个创新型的操作系统,它通过将大型语言模型嵌入到操作系统中,作为系统的核心'大脑',从而赋予了操作系统全新的生命力。与传统操作系统相比,AIOS通过深度学习和自然语言处理技术,能够更加智能地理解用户需...

Read More
2024-04-09 talkingdev

用C/CUDA语言训练大型语言模型,无需依赖PyTorch

近期,Andrei Karpathy推出了一个名为llm.c的项目,该项目展示了如何使用C和CUDA编程语言来训练大型语言模型(LLM)。这一创新方法避免了对PyTorch等大型深度学习框架的依赖,尤其是其所需的250MB以上的资源。这种训...

Read More
2024-04-09 talkingdev

企业如何有效融合大型语言模型提升产品价值

大型语言模型(LLMs)在提升公司内部效率方面的作用不容小觑,但其如何使产品对客户更具价值则是一大挑战。本文深入探讨了如何将大型语言模型有意义地整合到现有产品中,包括对这一技术的思考、工作流程的改造、模型...

Read More
  1. Prev Page
  2. 27
  3. 28
  4. 29
  5. Next Page