一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...
Read More近日上线的Fourty.News项目通过技术创新实现了独特的新闻阅读体验——将40年前的历史新闻经过AI处理重新编排成每日资讯。该项目采用多步骤大语言模型流水线技术:首先通过OCR将旧报纸扫描件转为文本,随后运用包含戏剧...
Read More哈佛大学图书馆创新实验室近期提出了一种突破性的数据发现方案,通过DuckDB-WASM技术实现在浏览器中直接处理TB级数据。这项技术将传统需要服务器集群支撑的大数据分析能力下沉到前端,用户无需安装任何软件即可在网...
Read More十年前,一位博主通过博客呼吁美国政府公开其珍藏的水果水彩画系列——美国农业部果树学水彩画集(Pomological Watercolor Collection)。这一系列包含超过7000幅绘制于1880年代至1940年代的水果及其他生物标本画作,...
Read More