漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-22 talkingdev

AI应用步入实践时代,巨头们需紧跟时代发展

近期,AI领域的重大进展,特别是谷歌的Gemini提供了超过一百万标记的上下文窗口,以及Groq的硬件使得GPT-3.5模型的响应几乎是即时的,这标志着AI应用迈入了实践时代,同时也凸显了领袖们理解和适应快速演变的AI应用...

Read More
2024-02-16 talkingdev

谷歌推出下一代AI模型Gemini 1.5,开发者和企业用户可以提前体验

谷歌推出了Gemini 1.5,开发者和企业用户可以提前体验,而消费者版的全面推出还需要等待。新版Gemini的性能高端,与谷歌最近推出的高端Gemini Ultra相媲美。Gemini 1.5采用了专家混合技术,使得模型对于用户而言更快...

Read More
2023-10-03 talkingdev

流媒体LLM:一种理论上可以支持无限上下文窗口大小的语言模型算法更新

语言模型的性能往往受到其上下文长度的限制。一般来说,上下文长度的限制主要源于计算硬件和聪明的算法更新。StreamingLLM(Github Repo)提供了一种算法更新,通过将令牌流式传输至注意力机制,理论上可以支持无限...

Read More
2023-06-19 talkingdev

百万上下文窗口背后的秘密武器

本文讨论了几种加速大型语言模型(LLM)训练和推理的技术,以使用高达100K个输入令牌的大上下文窗口。这些技术包括:ALiBi位置嵌入,稀疏注意力,闪电注意力,多查询注意力,条件计算以及使用80GB的A100 GPU。

Read More
2023-06-01 talkingdev

OpenAI 未来计划:Sam Altman分享路线图

## 新闻内容: OpenAI 的 CEO Sam Altman 分享了公司的路线图,其中包括以下亮点: - 推出更便宜、更快速的 GPT4 - 增加更长的上下文窗口 - 推出更精细的 API 和有状态的 API - 在 2024 年实现多模态 ## 三大要点:...

Read More
2023-05-17 talkingdev

首个RNN在Transformers库中发布

近日,基于线性注意力模型与内置循环的RWKV模型成为Transformers库中首个推出的RNN模型。该模型是一个强大的语言模型,理论上可运行较长的上下文窗口,并具有快速的运行速度。目前,该模型在HuggingFace平台上的开发...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5