漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-22 talkingdev

小模型公司Sakana AI获得3000万美元种子轮融资

Sakana.ai正在东京建立世界级研究实验室,以建立更小、更高效的基础模型。该公司由前谷歌研究员David Ha和Llion Jones创立,他们负责转型、世界模型和LoRA等突破性技术。它已获得了来自Lux Capital的Brandon Reeves...

Read More
2024-01-22 talkingdev

MarketMind-基于AI的市场洞察产品

智能AI技术的快速发展让市场洞察变得更加高效。业内领先的MarketMind产品,通过一系列算法,可以快速的分析市场趋势,帮助企业在短短几分钟内制定出相应的应对策略。这样的效率,让企业在激烈的市场竞争中占据先机。...

Read More
2024-01-22 talkingdev

UV-SAM-探测城市村庄边界的新方法开源

近日,一项名为UV-SAM的新技术通过GitHub仓库公开,该技术是对视觉基础模型和Segment Anything模型的改进,利用卫星图像可以准确识别出城市村庄的边界。与传统的现场调查相比,UV-SAM提供了一种高效的替代方案,结合...

Read More
2024-01-21 talkingdev

探测城市村庄:基于卫星图像的UV-SAM模型

本研究介绍了UV-SAM,这是一种基于视觉基础模型和Segment Anything Model的改进模型,可以准确地识别城市村庄的边界。UV-SAM将不同的图像表示结合起来,为精确探测提供了高效的替代方案。相对于传统的野外调查,UV-S...

Read More
2024-01-21 talkingdev

DoraemonGPT:基于LLM的AI系统在视频理解方面迈出重要一步

最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...

Read More
2024-01-20 talkingdev

Vlogger开源,AI系统提供分钟级别的短视频制作

近日,AI系统Vlogger在GitHub上推出了自己的仓库,为用户提供分钟级别的视频博客制作服务。Vlogger的制作流程分为四个阶段:脚本、演员、节目制作和配音,每个阶段都代表着视频制作的不同方面。用户只需要向Vlogger...

Read More
2024-01-16 talkingdev

Surya开源,多语言OCR工具包提供准确的文本检测

排线检测是在图像或PDF中在文本行周围放置一个边界框的过程。Surya是一个非常强大的多语言排线检测模型,并已在GitHub上开源发布。该模型可以识别多种语言,包括中文、英文、法文、德文和印地文等,并且可以在不同的...

Read More
2024-01-15 talkingdev

MiniMA项目开源:高效压缩的语言模型

MiniMA项目致力于将大型语言模型压缩成小型学生模型的挑战。研究人员发现了不同学生模型的一致最优容量差,并利用这一发现创建了MiniMA,它是从一个7B教师模型中压缩出来的3B模型。MiniMA在效率和性能方面创造了新的...

Read More
  1. Prev Page
  2. 127
  3. 128
  4. 129
  5. Next Page