近日,DeepSeek公司发布了其最新的R1-Zero和R1技术架构,引发了业界的广泛关注。R1-Zero作为一款轻量级模型,专注于低资源环境下的高效运行,特别适用于边缘计算和物联网设备。其采用了先进的LoRA技术,能够在保持高...
Read More近日,一款名为SmolGPT的轻量级PyTorch实现框架正式发布,旨在帮助开发者从零开始训练小型LLM(Large Language Model)。该框架以其简洁的设计和高效的性能吸引了广泛关注。SmolGPT通过优化模型结构和训练流程,显著...
Read More近日,一种名为Jank的新编程语言引起了技术社区的广泛关注。Jank语言旨在结合C++的高性能与Clojure的函数式编程优势,为开发者提供一种兼具效率与灵活性的编程工具。C++以其高效的执行速度和底层控制能力著称,而Clo...
Read MoreAbdomenAtlas 3.0近日正式发布,成为首个包含高质量腹部CT扫描与配对放射报告的公开数据集。该数据库涵盖了超过9,000例CT扫描,每例扫描均配有详细的放射报告,并提供了肝脏、肾脏和胰腺肿瘤的逐体素注释。这一数据...
Read MoreAI Agent代理正从被动工具转变为主动系统,有望通过颠覆传统软件堆栈来重新定义企业软件。Yohei Nakajima提出了代理的四个自主级别,强调了从固定功能到预见性自建的进步。尽管这些代理具有巨大潜力,但它们需要安全...
Read More近日,一项关于CoT(Chain-of-Thought)推理在自回归图像生成领域的研究项目引发了广泛关注。该项目通过探索CoT推理的潜力,旨在提升自回归图像生成模型的表现。自回归模型在图像生成任务中通常依赖于逐步预测像素值...
Read More1Prompt1Story是一种无需训练的文本到图像生成方法,通过单一串联提示实现一致的图像生成。该方法的核心在于将多个提示信息串联成一个整体,从而在生成过程中保持一致性。与传统的训练依赖型方法不同,1Prompt1Story...
Read More本文综述了基础模型的参数高效微调技术,深入探讨了在保持多样化任务性能的同时,如何最小化计算成本的方法。随着基础模型(如LLM)的广泛应用,参数高效微调技术(如LoRA、RAG等)成为研究热点。这些技术通过减少需...
Read More