漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-15 talkingdev

HyperRouter方法开源,提高LLM训练效率

HyperRouter方法提高LLM训练效率。该方法通过动态调整路由器参数,进一步提高了大型语言模型训练的效率。

Read More
2023-12-15 talkingdev

论文:一种高效压缩LLM模型方法

这项研究介绍了一种使用降阶建模压缩大型语言模型的方法,可以显著减少内存和时间限制,而无需高端硬件。由于大型语言模型在自然语言处理中的应用越来越广泛,因此压缩这些模型以提高计算效率变得尤为重要。研究人员...

Read More
2023-12-15 talkingdev

Natrue:DeepMindAI在未解问题上超过了人类数学家

FunSearch是一种人工智能系统,可以与特别训练的大型语言模型进行交互,创建生成数学问题解决方案的计算机程序。该系统会检查这些解决方案是否优于已知的解决方案,如果不是,它会向LLM提供反馈,以便下一轮改进。它...

Read More
2023-12-13 talkingdev

KwaiAgents发布AI代理系统,使用LLM模仿人类认知技能

KwaiAgents是一个先进的代理系统,使用大型语言模型来模仿人类认知技能。该系统可以应用于自然语言处理、语音识别等领域。KwaiAgents的开放源代码已经上传至GitHub平台,使得更多的研究人员可以参与到该项目中来。该...

Read More
2023-11-24 talkingdev

Andrej Karpathy的入门级LLM科普介绍视频

本次大型语言模型介绍将讨论它们是什么,它们的发展方向,与现有操作系统的比较和类比以及该领域的一些安全相关挑战。大型语言模型是如今人工智能研究中一个非常重要的部分,近年来得到了广泛关注和应用。它们的出现...

Read More
2023-11-23 talkingdev

亚马逊据称正在使用两倍于GPT-4的参数进行AI训练

亚马逊正在为进入AI竞赛做准备,推出Olympus,这是一个拥有2万亿参数的大型语言模型,旨在超越OpenAI的GPT-4和谷歌的Bard。这一举措有望将亚马逊推向人工智能技术的前沿。虽然目前尚不清楚Olympus的推出时间表,但它...

Read More
2023-11-23 talkingdev

谷歌推迟Gemini的发布

谷歌推迟了其大型语言模型(LLM)和GPT-4竞争对手Gemini的发布时间,直到2024年第一季度,原因是担心其无法达到或超越OpenAI的GPT-4,并且着重于在允许外部开发人员访问之前加强其消费者产品。

Read More
2023-11-23 talkingdev

微软和英伟达简化了在Windows上运行AI模型的过程

微软宣布了Windows AI Studio,这是一个供开发人员访问和配置AI模型的中心,提供了来自Azure AI Studio和Hugging Face的工具以及模型配置界面和性能测试模板等功能。英伟达更新了其TensorRT-LLM,支持GeForce RTX 30...

Read More
  1. Prev Page
  2. 38
  3. 39
  4. 40
  5. Next Page