漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-10 talkingdev

微软正研发内部模型 MAI-1,力求超越谷歌和OpenAI的主要AI模型

根据最新消息,微软正在开发一种名为MAI-1的新型人工智能模型。据悉,这款新型AI模型拥有大约5000亿的参数,目标是超越谷歌和OpenAI的主要人工智能模型。微软一直在AI领域持续进行研发和创新,这次的内部模型MAI-1的...

Read More
2024-05-09 talkingdev

OpenAI确认GPT-2-Chatbot为其新型AI模型

近期在LMSYS舞台上出现的gpt-2-chatbot已被确认为OpenAI的新型模型。该确认源于一次429速率限制错误,此错误揭示了来自OpenAI API的相关细节。GPT-2-Chatbot的出现,预示着OpenAI在人工智能领域的新进展和发展。此次...

Read More
2024-05-07 talkingdev

DeepSeek发布200B+参数模型——DeepSeek-V2

DeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2,其中激活参数达到210亿。无论是在编码还是推理方面,该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型,但无疑,...

Read More
2024-05-06 talkingdev

苹果Ajax LLM技术升级iOS18 Siri AI 功能,Safari和Spotlight Search新增AI增强功能

苹果公司即将在iOS 18中,为Safari、Spotlight Search和Siri增强AI相关功能。Safari的其中一个关键功能是文本摘要。 Siri也将获得类似的更新,使其能够以简化的方式生成响应来传递消息的内容。苹果的AI模型将完全在...

Read More
2024-05-02 talkingdev

头部AI创业公司面临财务压力考验

高调的人工智能创业公司如Inflection AI、Stability AI和Anthropic正面临财务压力,因为他们在开发生成式AI模型的高昂成本上挣扎。虽然由Microsoft支持的OpenAI已经展示出收入增长,但像Anthropic和Stability AI这样...

Read More
2024-05-02 talkingdev

神秘的AI模型gpt2-chatbot引发热议,OpenAI下一代产品的预告?

近日,一款名为gpt2-chatbot的神秘AI模型在lmsys.org网站上引发关注,其展示的能力类似于GPT-4.5,这引起了人们对其是否是OpenAI未公开的下一代产品测试的猜测。关键标识如响应质量、OpenAI特有的特征和频率限制等都...

Read More
2024-05-01 talkingdev

QUICK:加速LLM的新CUDA内核开源

QUICK是一套新的优化CUDA内核,通过解决内存问题,提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升,使AI模型运行更快,效率更高。QUICK的出现,无疑为AI领域带来了新的可能性,通过优化内存处理方式...

Read More
2024-05-01 talkingdev

Nvidia推出CUDA-checkpoint工具包:助力分布式训练大型AI模型

Nvidia最近发布了一个新的工具包,可以对CUDA状态进行检查点设置,以便于传输和重启。这一工具包在GitHub上公开,对于大型AI模型的分布式训练非常有用。CUDA状态的检查点设置可以在训练过程中保存模型的状态,以便在...

Read More
2024-05-01 talkingdev

苹果从谷歌挖来AI专家,秘密在欧洲设立AI实验室

苹果公司近期积极扩大其人工智能能力,从谷歌公司挖来了众多AI专家,并在瑞士苏黎世秘密设立了一个AI研究实验室。这个被称为“视觉实验室”的研究机构,专注于开发能集成文本和视觉输入的先进AI模型。这一系列举措标志...

Read More
2024-04-30 talkingdev

Moondream 2模型驱动的llamafile全功能VLM可执行文件

Moondream 2模型作为一种高效的AI模型,其性能强大且体积小巧,现已发布其全功能的VLM可执行文件,名为llamafile。这款全功能的VLM可执行文件是一种完全自包含的程序,可以在边缘设备上运行。这意味着,即使在没有网...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page