漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-30 talkingdev

深度解析DeepSeek的R1-Zero与R1技术架构

近日,DeepSeek公司发布了其最新的R1-Zero和R1技术架构,引发了业界的广泛关注。R1-Zero作为一款轻量级模型,专注于低资源环境下的高效运行,特别适用于边缘计算和物联网设备。其采用了先进的LoRA技术,能够在保持高...

Read More
2025-01-30 talkingdev

SmolGPT:基于PyTorch的轻量级LLM训练框架开源

近日,一款名为SmolGPT的轻量级PyTorch实现框架正式发布,旨在帮助开发者从零开始训练小型LLM(Large Language Model)。该框架以其简洁的设计和高效的性能吸引了广泛关注。SmolGPT通过优化模型结构和训练流程,显著...

Read More
2025-01-30 talkingdev

Jank语言:融合C++与Clojure优势的新编程语言

近日,一种名为Jank的新编程语言引起了技术社区的广泛关注。Jank语言旨在结合C++的高性能与Clojure的函数式编程优势,为开发者提供一种兼具效率与灵活性的编程工具。C++以其高效的执行速度和底层控制能力著称,而Clo...

Read More
2025-01-28 talkingdev

AbdomenAtlas 3.0发布:首个高质量腹部CT与放射报告配对公开数据集

AbdomenAtlas 3.0近日正式发布,成为首个包含高质量腹部CT扫描与配对放射报告的公开数据集。该数据库涵盖了超过9,000例CT扫描,每例扫描均配有详细的放射报告,并提供了肝脏、肾脏和胰腺肿瘤的逐体素注释。这一数据...

Read More
2025-01-28 talkingdev

自建AI Agent的悖论:如何教会AI自我学习

AI Agent代理正从被动工具转变为主动系统,有望通过颠覆传统软件堆栈来重新定义企业软件。Yohei Nakajima提出了代理的四个自主级别,强调了从固定功能到预见性自建的进步。尽管这些代理具有巨大潜力,但它们需要安全...

Read More
2025-01-28 talkingdev

CoT推理助力自回归图像生成技术突破

近日,一项关于CoT(Chain-of-Thought)推理在自回归图像生成领域的研究项目引发了广泛关注。该项目通过探索CoT推理的潜力,旨在提升自回归图像生成模型的表现。自回归模型在图像生成任务中通常依赖于逐步预测像素值...

Read More
2025-01-28 talkingdev

1Prompt1Story:无需训练的文本到图像生成新方法

1Prompt1Story是一种无需训练的文本到图像生成方法,通过单一串联提示实现一致的图像生成。该方法的核心在于将多个提示信息串联成一个整体,从而在生成过程中保持一致性。与传统的训练依赖型方法不同,1Prompt1Story...

Read More
2025-01-28 talkingdev

论文:基础模型参数高效微调技术综述

本文综述了基础模型的参数高效微调技术,深入探讨了在保持多样化任务性能的同时,如何最小化计算成本的方法。随着基础模型(如LLM)的广泛应用,参数高效微调技术(如LoRA、RAG等)成为研究热点。这些技术通过减少需...

Read More
  1. Prev Page
  2. 179
  3. 180
  4. 181
  5. Next Page