大型语言模型的相关内容 - 漫话开发者

2024-04-10 talkingdev

苹果新AI模型助力Siri理解iOS应用界面

苹果公司开发了一款名为Ferret-UI的多模态大型语言模型（LLM），该模型具备理解移动设备用户界面的能力，有望让Siri更有效地理解并与屏幕上的元素进行互动。Ferret-UI的出现预示着Siri将能够更加直观地与iOS应用进行...

2024-04-10 talkingdev

近日，开发者社区GitHub上出现了一项名为SqueezeAttention的新技术，该技术针对大型语言模型（LLMs）的键值缓存进行了优化。通过SqueezeAttention，内存使用量能够显著降低30%至70%，同时吞吐量也得到了翻倍提升。这...

2024-04-10 talkingdev

近日，GitHub上发布了一项新的基准测试工具——化学工作台（Chemistry Bench），旨在评估大型语言模型在处理化学问题方面的能力。该工具与Big-Bench兼容，能够对语言模型的科学素养进行有效衡量。化学工作台通过一系列...

2024-04-10 talkingdev

人工智能的发展，尤其是像GPT-3这样的大型语言模型，严重依赖于大量数据。随着高质量在线数据可能在2026年耗尽，科技公司如Meta和Google正竞相收集更多数据。这些科技巨头采用有争议的方法来推动他们的AI进步，包括...

2024-04-10 talkingdev

Meta公司近日确认，其最新一代大型语言模型Llama 3将于下月推出。Llama 3是Meta为其生成式人工智能助手而开发的先进技术，旨在提供更加精准、自然的对话体验。该模型经过深入的优化和升级，预计将为用户带来更加丰富...

2024-04-09 talkingdev

FlyFlow是一个专为优化基于大型语言模型（LLM）的应用程序而设计的API中间件。该中间件通过简化API调用流程，提高数据传输效率，使得开发者能够更加便捷地构建和维护基于LLM的应用程序。FlyFlow支持自动化的错误处理...

2024-04-09 talkingdev

AIOS是一个创新型的操作系统，它通过将大型语言模型嵌入到操作系统中，作为系统的核心'大脑'，从而赋予了操作系统全新的生命力。与传统操作系统相比，AIOS通过深度学习和自然语言处理技术，能够更加智能地理解用户需...

2024-04-09 talkingdev

近期，Andrei Karpathy推出了一个名为llm.c的项目，该项目展示了如何使用C和CUDA编程语言来训练大型语言模型（LLM）。这一创新方法避免了对PyTorch等大型深度学习框架的依赖，尤其是其所需的250MB以上的资源。这种训...