漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-15 talkingdev

[论文推荐]ThinkLite-VL:仅用1.1万训练样本实现视觉语言模型高效推理

近期发表于arXiv的研究ThinkLite-VL通过创新性地应用蒙特卡洛树搜索(MCTS)技术量化样本难度,在视觉语言模型(VLM)领域取得突破性进展。该方法仅需11,000个训练样本即可显著提升模型推理能力,且无需依赖知识蒸馏...

Read More
2025-04-07 talkingdev

DeepSeek R1模型1.58bit量化新突破:MoE层实现超低比特压缩

Unsloth团队针对DeepSeek最新R1模型成功开发出创新量化方案,其核心突破在于将混合专家(MoE)层压缩至惊人的1.58bit,同时通过动态量化技术保持其他模块在4-6bit精度。研究发现,模型Tokenizer的特殊结构为量化带来...

Read More
2025-03-31 talkingdev

[开源]Mobile-VideoGPT:轻量级多模态视频模型,参数不足10亿却支持边缘设备实时推理

近日,GitHub上开源了一个名为Mobile-VideoGPT的轻量级多模态视频模型,其参数量不足10亿(1B),却通过创新的双视觉编码器和令牌剪枝技术,实现了在边缘设备上的实时推理能力。这一突破性进展为移动端和物联网设备...

Read More
2025-03-17 talkingdev

AI巨头效仿DeepSeek,利用“蒸馏”技术打造更经济的模型

近期,OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术,利用大型语言模型(LLM)作为“教师”来训练更小的系统,从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中,...

Read More
2025-01-21 talkingdev

探索小型语言模型的创新应用

近期,Hacker News上的一篇帖子引发了社区的热烈讨论,主题是关于小型语言模型(LLM)的创新应用。在这个数据驱动的时代,大型语言模型以其强大的功能和广泛的应用而备受瞩目。然而,小型语言模型以其较小的规模和较...

Read More
2024-10-19 talkingdev

AI工程师宣称新算法可减少95%的AI能耗

近日,一群AI工程师发布了他们的新研究成果,声称一种新算法能够显著降低人工智能的能耗达95%。这一突破性进展可能会为AI技术的可持续发展提供新的解决方案,尤其是在当前全球对能源效率要求日益严苛的背景下。该算...

Read More
2024-10-06 talkingdev

Starbase:边缘计算中的SQLite新变革

Starbase作为一个创新的平台,致力于将SQLite技术扩展到边缘计算环境。通过优化SQLite的性能和资源利用,Starbase为开发者提供了一个高效的数据库解决方案,特别适用于物联网和边缘设备的应用场景。该平台的设计理念...

Read More
2024-09-25 talkingdev

Llama 3.2:开创边缘AI与视觉革新之路

Llama 3.2 是一款全新的开源可定制模型,旨在推动边缘AI和计算机视觉的发展。该模型的设计能够灵活适应多种应用场景,从智能监控到无人驾驶汽车,Llama 3.2 提供了强大的支持。其核心优势在于可定制性,使开发者能够...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page