漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-25 talkingdev

cola,利用视觉语言模型增强视觉推理

Cola是一个使用大型语言模型来协调各种视觉语言模型(VLM)以改进视觉推理的系统。该代码库已经在GitHub上发布。

Read More
2023-10-24 talkingdev

React-Magic-Motion:React 动画库

React-Magic-Motion 是一个用于实现组件动画效果的 React 库。它允许开发者通过简单的封装即可轻松实现动画效果。该库提供了简单易用的 API,开发者可以通过编写简洁的代码实现各种复杂的动画效果。通过 react-magic...

Read More
2023-10-23 talkingdev

SoM开源,多模态语言模型的新进展

多模态语言模型(multimodal language models)的发展正日益成熟。最近,一种名为State of Mark prompting的方法在GitHub Repo上引起了广泛关注。该方法首先使用Segment Anything算法对图像进行处理,对检测到的类别...

Read More
2023-10-23 talkingdev

upsampling开源库实现图像生成模型数据质量提升

DALLE-3图像生成模型的质量提升的主要驱动力之一是改进后的数据质量。通过使用内部模型进行标题上采样来实现。这里提供了一个使用强大的开源模型进行实现的GitHub开源库。

Read More
2023-10-23 talkingdev

SolidGPT开源,让代码仓库更智能

SolidGPT是一款基于GitHub的人工智能工具,旨在提高代码仓库的智能程度。该工具利用了OpenAI的GPT技术,可以与代码仓库进行交互式对话,从而使用户能够更好地理解和学习代码,提高代码质量和减少错误率。SolidGPT还...

Read More
2023-10-19 talkingdev

BitNet新设计开源:更高效的语言模型架构

研究人员开发出BitNet,这是一种新的大型语言模型设计,使用更少的能量和内存。BitNet使用一种新的技术来平衡模型的准确性和计算效率,同时减少了对大量数据的依赖。这一新设计的目的是为了降低大型语言模型的计算成...

Read More
2023-10-19 talkingdev

MonoSKD开源,一张图像实现3D物体检测

MonoSKD是一种革命性的方法,它使用一张图像就可以检测3D物体,有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征,而MonoSKD仅需要一张图像就能完...

Read More
2023-10-19 talkingdev

ChatGPT系统提示指南

系统提示可以改变基于ChatGPT的语言模型的行为。这个代码仓库包含一些非常好的系统提示,可以根据您的偏好改善可用性。

Read More
  1. Prev Page
  2. 144
  3. 145
  4. 146
  5. Next Page