漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-05 talkingdev

ElysiaJS:打造卓越开发体验的Bun TypeScript框架

近日,Bun TypeScript框架的新成员ElysiaJS在GitHub上线,该框架注重开发体验,采用端到端的类型安全和统一的类型系统。ElysiaJS采用了一种新型架构,允许开发人员在遵循最佳实践的同时灵活地构建应用程序。此外,El...

Read More
2024-03-04 talkingdev

UniVS:基于提示词的统一视频分割架构

UniVS是一种用于视频分割的统一架构,采用新颖的基于提示的方法应对各种分割任务的挑战。通过将提示特征作为查询并引入目标感知的提示交叉注意力层,UniVS消除了启发式的帧间匹配需求,可以无缝适应不同的视频分割场...

Read More
2024-02-26 talkingdev

谷歌开源轻量级CPP Gemma推理引擎

谷歌工程师和科学家开发了一个新的代码库,名为CPP Gemma推理引擎。与llama.cpp类似,该代码库允许在SIMD CPU架构上进行推理。该工具的目的是鼓励实验和使用昨天发布的Gemma模型。

Read More
2024-02-26 talkingdev

Stability AI发布Stable Diffusion 3,模型参数达80亿

Stability AI宣布推出Stable Diffusion 3,这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型,参数范围从8亿到80亿,这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...

Read More
2024-02-22 talkingdev

BoCoEL开源:利用贝叶斯优化准确评估LLMs

近日,开源项目BoCoEL在GitHub上发布。BoCoEL是一个用于准确评估LLMs的工具,采用贝叶斯优化方法,能够从大量的LLMs中找到最佳的架构和超参数组合。BoCoEL可以帮助研究者更快地训练出高效的LLMs,提高模型的准确性和...

Read More
2024-02-22 talkingdev

Flexible Vision Transformer开源,可生成任意分辨率图片

GitHub上发布了一个名为“Flexible Vision Transformer”的仓库,该架构设计用于创建任意分辨率和纵横比的图像。与传统模型不同,FiT将图像视为变量大小的标记序列,在训练和推理过程中更有效地适应不同的图像大小。这...

Read More
2024-02-21 talkingdev

KV Quant - 缩放至1000万个令牌

KV缓存的量化是Transformer架构的一个技术细节,它使其在推理时使用更少的内存。量化是在最小损失质量的情况下缩小浮点精度。

Read More
2024-02-20 talkingdev

Sora相关参考论文合集整理

HuggingFace Hub最近发布了全新的视频模型Sora,现在提供了30篇相关的论文。这些论文包括了从模型架构到训练技巧等方面的研究,为研究人员和开发者提供了很好的参考。此外,这些论文还包括了Sora model在计算机视觉...

Read More
2024-02-19 talkingdev

软银创始人计划筹集1000亿美元,打造人工智能芯片公司,与英伟达竞争

Izanagi项目是软银创始人的一项新芯片计划,旨在在人工智能处理器领域与英伟达竞争。该项目旨在补充软银的Arm Holdings,后者设计处理器架构。目前尚不清楚Izanagi项目设计的人工智能处理器是否将依赖Arm开发的技术...

Read More
2024-02-15 talkingdev

Stable与Wurstchen发布新的文本到图像模型

Stable Cascade模型是一种新的仅用于研究的文本到图像模型,其在美学、提示忠实度和文本质量方面优于SDXL。它是使用Würstchen架构进行训练的,并具有多步架构,使调整变得容易。该模型的稳定性能够有效地提高图像生...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page