阅读的相关内容 - 漫话开发者

2023-06-05 talkingdev

谷歌推出生成式AI课程

## 新闻内容： - 虽然这个领域正在快速发展，但生成式机器学习的基础已经相当稳固。 - 这个由9部分组成的课程涵盖了很多内容，适合对该领域感兴趣的人学习。 - 最终目标是将新用户引入他们的ML云产品Vertex。即使如...

2023-06-05 talkingdev

近日，谷歌通过基因搜索算法和海量TPU的使用，开发出了一种新的模型——Brainformer，其收敛速度比传统的Transformer模型快5倍，推理速度快2倍。这种模型使用了MoE模块和一些其他巧妙的技巧，充分发挥了TPU的强大性能...

2023-06-02 talkingdev

在这篇5分钟阅读的文章中，汉密尔顿·诺兰(Hamilton Nolan)认为，随着人工智能变得越来越成熟，CEO的角色正在变得越来越不必要。他认为我们应该将CEO职位自动化，并将CEO目前掌控的权力和财富分配给其他利益相关者，...

2023-06-02 talkingdev

最近MosaicML MPT模型仍然备受欢迎。其中一个重要的贡献是“Storywriter”模型，它可以在上下文中使用高达65k个标记。但是，使用这个模型进行推理非常缓慢。通过添加键/值缓存，我们可以将生成速度提高近10倍。 ## 内...

2023-06-02 talkingdev

谷歌多年来记录了其代码库的每一次更改，包括详细的描述、更改和修复。他们将其视为序列建模问题，并创建了一组强大的内部工具，可以帮助软件工程师提高效率。他们发现，这种方法即使在像“基于历史信息的生成”这样的...

2023-06-01 talkingdev

近日，BabyLM挑战赛成为了一项旨在开发更小但仍然有效的人工智能模型的举措。由于大型LLM模型的缺点，如更大的模型需要处理能力，而只有少数公司拥有这种能力，因此推动开发更小的AI模型已经成为了当前的趋势。 ###...

2023-06-01 talkingdev

## 新闻内容： OpenAI 的 CEO Sam Altman 分享了公司的路线图，其中包括以下亮点： - 推出更便宜、更快速的 GPT4 - 增加更长的上下文窗口 - 推出更精细的 API 和有状态的 API - 在 2024 年实现多模态 ## 三大要点：...

2023-05-31 talkingdev

## 新闻内容： - 近来，多种数据类型的多模态训练变得越来越受欢迎。 - 模型架构通常需要复杂且有点脆弱的解决方案。 - Gill是一个很酷的新项目，它将文本标记与图像标记交错使用，从而实现真正的多模态输入和输出...