漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-30 talkingdev

开源|Crawl4AI:专为大型语言模型设计的开源网页抓取与解析工具

近日,一个名为Crawl4AI的开源项目在GitHub上发布,旨在为大型语言模型(LLM)提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导,其核心目标是简化从复杂网页中提取结构化信息的流程,并将...

Read More
2025-12-25 talkingdev

开源|Crawl4AI:专为大型语言模型设计的开源网络爬虫与抓取工具

近日,一个名为Crawl4AI的开源项目在GitHub上发布,旨在为大型语言模型(LLM)提供友好的网络爬虫与数据抓取解决方案。该项目由开发者unclecode主导,其核心目标是简化从网页中提取结构化信息的过程,并将这些数据高...

Read More
2025-12-23 talkingdev

智谱AI发布GLM-4.7:新一代开源编码模型刷新SOTA,推理与多模态能力全面升级

近日,智谱AI正式发布了其通用语言模型系列的最新力作——GLM-4.7。作为一款高端基础模型,GLM-4.7的核心定位在于处理复杂的推理任务、专业级代码生成以及多模态工作负载。相较于前代版本,此次更新在多个维度实现了显...

Read More
2025-12-23 talkingdev

字节跳动加码AI军备竞赛:计划2026年投入1600亿人民币,其中超120亿美元专攻AI处理器

据《金融时报》援引知情人士消息,TikTok母公司字节跳动已制定初步计划,将在人工智能领域进行大规模资本支出。根据该计划,字节跳动2026年用于AI的资本支出(capex)预计将达到约1600亿元人民币(约合230亿美元),...

Read More
2025-12-23 talkingdev

图解Transformer经典:让复杂架构一目了然

一篇题为《图解Transformer》的技术博客在开发者社区Hacker News上引发了广泛关注,该博客由jalammar撰写,通过大量直观的图示和清晰的解释,深入浅出地剖析了Transformer这一革命性神经网络架构的核心工作原理。Tra...

Read More
2025-12-22 talkingdev

AI智能体记忆瓶颈破局:评估上下文压缩策略,结构化摘要表现优异

当AI智能体协助用户处理横跨数百条消息的复杂任务时,一旦其上下文窗口耗尽,是能够继续高效工作,还是被迫从头开始?这直接决定了智能体的实用性与可靠性。Factory.ai的最新研究深入探讨了这一问题,并提出了一套评...

Read More
2025-12-19 talkingdev

开源|History LLMs:训练于1913年前文本的“历史专家”大语言模型项目引发热议

一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...

Read More
2025-12-17 talkingdev

开源|通义千问推出Qwen-Doc项目,专注长文档理解与智能解析

阿里云通义千问团队近日在GitHub上开源了Qwen-Doc项目,这是一个专注于文档人工智能(Document AI)的开源计划。该项目旨在通过提供先进的模型和工具集,显著提升AI系统对长上下文文档的理解、解析能力,并支持基于...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page