漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-25 talkingdev

Meta发布开源代码与世界建模大模型CWM,探索代码生成新范式

Meta公司最新推出了名为CWM(Code World Model)的开源大语言模型,该模型参数量达320亿,采用仅解码器架构。其创新之处在于训练数据融合了代码执行轨迹与复杂推理任务,旨在构建能够理解代码动态执行过程的‘世界模...

Read More
2025-09-24 talkingdev

大语言模型核心解码:采样与结构化输出如何协同塑造下一代AI

在大型语言模型的技术架构中,采样与结构化输出是决定模型生成质量与可控性的两大核心技术。采样指模型根据概率分布从词汇表中选择下一个标记的过程,直接影响了文本生成的多样性和创造性。而结构化输出技术则赋予模...

Read More
2025-09-22 talkingdev

开源|Crawl4AI:专为大型语言模型设计的开源网页爬虫与抓取工具

Crawl4AI是一款新近开源的网页爬虫与内容抓取工具,其核心设计理念是高度适配大型语言模型(LLM)的数据处理需求。该项目由开发者unclecode在GitHub平台发布,旨在解决传统爬虫工具在处理动态网页、JavaScript渲染内...

Read More
2025-09-17 talkingdev

开源|GitHub正式推出MCP注册中心:一键发现AI开发工具新生态

GitHub近日重磅推出Model Context Protocol(MCP)注册中心,标志着AI辅助开发工具生态迈入标准化整合新阶段。该平台作为全球首个集中化MCP服务器发现库,实现了与VS Code开发环境的深度集成,支持开发者通过GitHub...

Read More
2025-09-16 talkingdev

开源|Semlib:用自然语言构建LLM驱动的数据处理与分析流水线

近日,GitHub上开源了一项突破性工具Semlib,这是一个基于Python的创新型库,专门用于构建利用大型语言模型(LLMs)的数据处理与分析流水线。Semlib通过提供函数式编程原语——如map(映射)、reduce(归约)、sort(...

Read More
2025-09-16 talkingdev

PyTorch与vLLM联手实现分解式推理,大幅提升大语言模型生产环境性能

Meta公司内部团队与vLLM、PyTorch展开深度技术合作,成功推出预填充/解码分离技术(prefill/decode disaggregation),这项突破性技术显著提升了大规模语言模型在生产环境中的推理性能。通过将推理过程分解为预填充...

Read More
2025-09-16 talkingdev

开源|RustGPT:纯Rust编写的Transformer架构大语言模型

RustGPT是一项具有里程碑意义的开源项目,它首次实现了完全基于Rust编程语言的大型语言模型(LLM)开发,不依赖任何外部机器学习框架。该项目采用纯Rust代码构建,仅使用ndarray库进行矩阵运算,彻底摆脱了对PyTorch...

Read More
2025-09-16 talkingdev

突破推荐系统边界:LLM与Semantic IDs融合实现可操控语义推荐

这项技术研究提出了一种革命性的推荐系统架构,通过将语义化标识符(Semantic IDs)嵌入大型语言模型,替代传统的随机哈希ID机制。该方案使LLM能够同时理解自然语言和项目语义标识,实现了无需外部检索工具的直接对...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page