漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-22 talkingdev

谷歌公布850+人联合论文,阐述Gemini语言模型的研究成果

Google的Gemini语言模型项目已经发表了一篇850多位作者的论文。该论文详细阐述了Gemini语言模型的研究成果,但缺乏关键的架构和数据集细节。该论文还提供了有关归因和评估的详细信息。

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-12-21 talkingdev

VideoPoet:谷歌语言模型在视频创作中大放异彩

Google的VideoPoet是一种开创性的语言模型,它在处理文本到视频,视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...

Read More
2023-12-20 talkingdev

Google Vision开源权重分片,提升多节点系统训练效率

Google的Big Vision项目是一个研究和生产最先进的视觉系统的重要工具库。最近,他们添加了权重分片,使得在多节点系统上的训练更加容易。这个新功能可以将模型分成多个子模型,分别在不同的节点上进行训练,最后再将...

Read More
2023-12-15 talkingdev

Google推出Imagen2,提供文本和标志生成功能

Google推出了Imagen 2,这是一种增强的AI图像模型,可供经批准的Google Cloud Vertex AI用户使用,提供文本渲染,标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...

Read More
2023-12-12 talkingdev

AI正在颠覆的行业并不是那么有利可图

谷歌的Gemini AI模型尽管有令人印象深刻的演示视频,但仅导致谷歌股票的微小增长,反映了对其实时功能的怀疑,因为演示使用的是预先录制的镜头和编辑过的回答。这种怀疑反映了AI行业的更广泛担忧,即公司创造了高期...

Read More
2023-12-08 talkingdev

优化LLMs使其可实现真实世界应用

Lightspeed分享了来自Google和TitanML关于通过提示或微调优化LLMs的内幕。 这些技术可以优化自然语言处理模型,从而帮助它们更好地适应真实世界的应用。 在这篇文章中,您将了解到这些优化技术的工作原理以及它们如...

Read More
2023-12-08 talkingdev

Google Gemini:原生多模态模型,文本能力达到GPT4水平

Google的旗舰机型Gemini是一款原生多模态模型,其文本能力达到了GPT4的水平,同时还能够处理许多其他数据序列。此外,它还训练了Alpha Code 2,这是一个在代码力量比赛中排名前15%的编码器。Alpha Code 2将在12月13...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page