漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-24 talkingdev

揭秘大语言模型推理机制:从输入到输出的技术全流程

大语言模型(LLM)作为基于Transformer架构的神经网络,通过并行分析完整序列并计算词语间的全局关联性,实现了自然语言处理的突破性进展。在推理过程中,模型首先将输入文本转化为数字化的词元嵌入向量,随后通过Tr...

Read More
2025-11-23 talkingdev

Fourty.News:用AI重现40年前新闻,在历史中寻找当下焦虑的解药

近日上线的Fourty.News项目通过技术创新实现了独特的新闻阅读体验——将40年前的历史新闻经过AI处理重新编排成每日资讯。该项目采用多步骤大语言模型流水线技术:首先通过OCR将旧报纸扫描件转为文本,随后运用包含戏剧...

Read More
2025-11-16 talkingdev

[开源]DeepAnalyze:首款自主数据科学智能体LLM问世,一键生成专业分析报告

中国人民大学数据实验室最新开源项目DeepAnalyze正式发布,这是全球首个面向自主数据科学的智能体大语言模型。该工具突破传统数据分析模式,通过AI代理架构实现全流程自动化数据分析,用户仅需上传数据集即可自动完...

Read More
2025-11-13 talkingdev

开源|JSX Tool:浏览器内实时样式编辑的React开发利器

JSX Tool作为一款创新的Chrome扩展工具,成功弥合了浏览器元素检查器与React组件选择器之间的技术鸿沟,为前端开发者提供了革命性的实时样式编辑体验。该工具通过深度集成React生态特性,支持在浏览器运行时直接定位...

Read More
2025-11-10 talkingdev

开源|runc项目面临LLM生成内容激增,社区正讨论制定审查政策

近日,容器运行时核心项目runc在GitHub官方仓库中发布重要议题,针对人工智能生成内容(LLM-generated)的代码提交和问题报告激增现象展开政策讨论。该项目维护者指出,近期接收的拉取请求和错误报告中明显出现由大...

Read More
2025-11-05 talkingdev

Grab自研视觉大模型文档处理,破解东南亚多语言OCR难题

东南亚科技巨头Grab近日宣布成功研发定制化视觉大语言模型,彻底革新传统OCR文档处理流程。该模型针对东南亚地区非标准化文档格式及多语言混合场景进行专项优化,通过重构开源架构实现推理速度提升50%,同时保持高精...

Read More
2025-11-05 talkingdev

超越标准大语言模型:线性注意力混合架构与文本扩散模型引领新浪潮

当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型,但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升,更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本,在创造...

Read More
2025-11-04 talkingdev

开源|Angular团队推出Web Codegen Scorer:大模型生成代码质量评估工具

谷歌Angular团队近日正式开源Web Codegen Scorer工具,专门用于评估大型语言模型生成的Web代码质量。该工具通过建立标准化的代码质量评估体系,支持跨模型、跨框架的横向对比分析,为AI代码生成技术的优化提供量化依...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page