最新研究发现,经过机器遗忘训练的大语言模型(LLMs)会留下可检测的行为和激活空间“指纹”。通过简单的分类器,可以以超过90%的准确率识别出这些遗忘痕迹。这一发现引发了关于隐私和版权的重大关切,尤其是在涉及敏...
Read More开发者Maciek-roboblog近日在GitHub开源了Claude-Code-Usage-Monitor项目,该工具能实时监控Claude代码生成服务的使用量并预测是否会在会话结束前达到上限。由于Claude对代码生成有严格的使用限制,许多开发者在编程...
Read More近日,一篇关于同态加密CRDTs(无冲突复制数据类型)的技术文章引发了广泛讨论。同态加密作为一种前沿加密技术,允许计算机直接在加密数据上执行程序而无需解密,为数据隐私和安全开辟了新途径。作者通过交互式示例...
Read MoreRomM是一款开源自托管应用(AGPLv3协议),专为复古游戏爱好者设计,可将散乱的ROM文件转化为带元数据的可视化游戏库。其核心功能包括:1) 自动从在线数据库抓取游戏封面、描述等元数据,类似Plex对影视库的智能化管...
Read More一项突破性研究通过对比模型在随机数据(无法泛化)和真实文本上的训练表现,开发出区分记忆与泛化的新方法。研究发现,模型会先记忆训练数据直至容量饱和,随后转向学习通用模式。以GPT类Transformer为例,每个参数...
Read More近日,GitHub上出现了一款名为Scraperr的自托管网页抓取工具,引发了开发者和技术爱好者的广泛关注。该项目由开发者jaypyles创建,旨在为用户提供一个灵活、可定制的网页抓取解决方案。与传统的云端抓取服务不同,Sc...
Read More近日,开源项目Rybbit在GitHub上发布,旨在提供一个隐私友好且更直观的Google Analytics替代方案。Rybbit不仅完全开源,还通过简化用户界面和数据分析流程,显著提升了易用性,据称比Google Analytics直观10倍。随着...
Read More谷歌研究院近日宣布启动一项名为Amplify的全球数据收集计划,通过与各地区本土专家合作,旨在提升人工智能在服务不足地区的适用性。该计划聚焦非主流语言和文化场景下的数据缺口,采用社区共建模式采集高质量标注数...
Read More