IBM近日宣布,将其Granite代码模型开源,以便更好地服务于开源社区,推动各平台的编程工作更为轻松和高效。这些模型的参数量在3亿到340亿之间,并覆盖了多种编程任务。这一举动,对于开发者们来说无疑是一大福音,他...
Read MoreWebLlama是一个设计精良的模型,能够浏览网页并据此回答相关问题。这种模型可用于生成高质量的预训练数据集,或者执行需要从网页查询信息的研究。WebLlama的目标是通过模型的训练,使其能够更好地理解和处理网络信息...
Read Morepg_lakehouse是一款扩展工具,它可以将Postgres转化为对象存储上的分析查询引擎。将非运营数据移动到云数据仓库或操作新的查询引擎来查询数据是昂贵且耗时的。pg_lakehouse允许直接从Postgres查询这些数据,无需新基...
Read MoreLumina是一个新一代的项目,其目标是成为统一的文本到X生成模型。这个项目的训练涉及到图像、视频、音频和文本的交替,这种方法提高了下游性能。Lumina项目带来的这种全新技术,将对未来的人工智能、机器学习和深度...
Read MoreMirage项目是一个多层次的张量优化引擎,能够产生极高性能的线性代数模块内核。它利用了张量的多层结构,进行深度优化,从而实现了高度优化的内核计算。在GitHub上,Mirage项目已经开源,并得到了广大开发者的热烈追...
Read MoreHazy研究团队最新推出一款名为ThunderKittens的CUDA DSL,旨在帮助开发者更简单、更高效地编写CUDA内核。据了解,该团队已经用这款新工具编写了flash attention模块,结果表明其运行速度比原版本快了30%,而且仅需10...
Read More近期,关于如何扩展语言模型的语境的讨论引起了业界的关注。这次讨论并未提供太多的评估方法,但却对语言模型领域的探索方向提供了深度剖析。语言模型的语境是机器学习和自然语言处理中的关键组成部分,对于提高模型...
Read MoreDiffMatch是一种新颖的半监督变化检测方法,它利用视觉语言模型为未标记的数据合成伪标签,从而提供额外的监督信号。通过这种方式,DiffMatch能够更精确地检测图像中的变化,提高了图像处理和分析的效率和准确性。此...
Read More