漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-05 talkingdev

Grab自研视觉大模型文档处理,破解东南亚多语言OCR难题

东南亚科技巨头Grab近日宣布成功研发定制化视觉大语言模型,彻底革新传统OCR文档处理流程。该模型针对东南亚地区非标准化文档格式及多语言混合场景进行专项优化,通过重构开源架构实现推理速度提升50%,同时保持高精...

Read More
2025-11-05 talkingdev

超越标准大语言模型:线性注意力混合架构与文本扩散模型引领新浪潮

当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型,但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升,更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本,在创造...

Read More
2025-11-03 talkingdev

大语言模型涌现自省能力:Anthropic研究揭示AI内省潜力

Anthropic最新研究通过‘概念注入’实验,首次系统验证了大语言模型的内省能力。研究显示,特别是Claude Opus 4和4.1版本模型能够检测并识别被注入的概念,并能通过参照自身‘意图’来识别意外输出。实验证明这些模型具...

Read More
2025-10-31 talkingdev

Hugging Face发布《Smol训练手册》:揭秘构建顶尖大语言模型的完整实战指南

知名AI社区Hugging Face近日发布了一份名为《Smol训练手册》的深度技术指南,首次系统披露了从零开始训练大语言模型的全流程实战经验。该手册覆盖了模型训练生命周期的关键阶段:从小规模消融实验和基础设施调试,到...

Read More
2025-10-29 talkingdev

开源|Dexto:构建能思考、行动与对话的AI智能体开发框架

近日,GitHub开源项目Dexto引发开发者社区广泛关注。作为专为AI智能体设计的智能层框架,Dexto通过协调大语言模型、工具链与数据源,将自然语言指令转化为可执行动作。其核心价值在于提供配置驱动的开发范式,支持命...

Read More
2025-10-29 talkingdev

智能体AI面临重大安全漏洞:提示注入攻击威胁数据安全

最新研究揭示,基于大语言模型(LLM)的智能体AI系统存在根本性安全缺陷——模型无法有效区分指令与数据,导致其极易遭受提示注入攻击。攻击者可通过在Jira工单、网页内容等非受信源中嵌入隐藏指令,诱使具有敏感数据...

Read More
2025-10-28 talkingdev

开源|TOON:专为LLM设计的轻量级数据结构表示法,令牌成本减半

近日,GitHub上开源项目TOON(Token-Oriented Object Notation)引发开发者社区广泛关注。这一由开发者johannschopplich推出的新型数据格式,专为大语言模型(LLM)输入优化设计,通过精简的结构化数据表示方式,显...

Read More
2025-10-26 talkingdev

OxDraw:基于Rust的“代码即图表”工具,支持拖拽自定义

开发者RohanAdwankar近日开源了基于Rust语言构建的图表工具OxDraw,创新性地将声明式图表生成与交互式编辑能力融合。该工具解决了技术文档创作中的核心痛点:传统代码驱动图表工具(如Mermaid.js)虽能快速生成基础...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page