漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-27 talkingdev

AI领域的新星:Adept如何改变游戏规则

在这篇访谈中,我们深入探讨了David Luan的职业历程,他曾是OpenAI的早期员工、Google大型语言模型项目的领导者之一,以及Google Brain的共同领导。Luan也是Adept的创始人,该公司是AI代理领域的佼佼者。他分享了在...

Read More
2024-03-26 talkingdev

Cerebras推出新型CS3芯片,支持24T参数语言模型训练

Cerebras公司近日推出了其最新款的CS3晶圆芯片,该芯片具备训练高达24T参数语言模型的能力。CS3芯片的发布,标志着在人工智能领域对高性能计算芯片的需求得到了进一步的满足。这款芯片原生支持PyTorch,使得开发者能...

Read More
2024-03-25 talkingdev

AI系统“内心独白”能力,推理能力大幅提升

研究人员开发了一种名为“Quiet-STaR”的新技术,通过赋予AI系统“内心独白”,显著提升了其在推理测试中的性能。该技术已经被应用于Mistral 7B语言模型,并且取得了令人瞩目的效果。这一项技术的进步意味着AI系统能够更...

Read More
2024-03-25 talkingdev

Databricks Mosaic团队分享fp8训练技巧与精度降低带来的优势

Databricks Mosaic团队在语言模型训练领域不断创新。在最近的一篇文章中,他们讨论了用于fp8训练的训练技术栈,以及通过降低精度所带来的一些优势。fp8作为一种新兴的计算精度格式,能够在保持足够精度的同时,大幅...

Read More
2024-03-25 talkingdev

人工智能领域巨头合并引发行业担忧

近期,微软对Inflection人才的收购再次激起了关于科技巨头公司在人工智能发展中控制过度的争论。虽然这些公司拥有的资源可以在核心语言模型上快速取得进展,但人们对于权力集中可能限制创新和透明度的担忧是有道理的...

Read More
2024-03-25 talkingdev

Mistral发布7B模型v0.2版本,公布语言模型微调代码

Mistral公司近期举办了一场黑客马拉松活动,并在此期间宣布了其7B语言模型的v0.2版本。同时,Mistral还发布了如何对其语言模型进行微调的代码。这些代码编写得整洁而简明,易于理解和使用。微调代码的发布,将有助于...

Read More
2024-03-25 talkingdev

深度解析:利用ChatGPT为SQLite构建C语言扩展

本文深入探讨了如何利用ChatGPT(或任何语言模型)为一个复杂任务编写不熟悉语言的代码。作者使用ChatGPT的代码解释器为流行的数据库SQLite编写、编译并下载新的绑定。这项技术不仅展示了ChatGPT在编程领域的潜力,...

Read More
2024-03-22 talkingdev

Meta推出Torchtune库,助力PyTorch语言模型微调

Meta公司近日发布了一个名为Torchtune的原生PyTorch库,专门用于精细调整语言模型。该库旨在为开发者提供更为便捷的工具,以便在PyTorch框架中进行语言模型的微调工作。通过Torchtune,开发者可以更容易地实现模型性...

Read More
  1. Prev Page
  2. 39
  3. 40
  4. 41
  5. Next Page