中国人民大学数据实验室最新开源项目DeepAnalyze正式发布,这是全球首个面向自主数据科学的智能体大语言模型。该工具突破传统数据分析模式,通过AI代理架构实现全流程自动化数据分析,用户仅需上传数据集即可自动完...
Read More近日,数据工程领域开展了一项重要的性能基准测试,针对当前主流的四大数据处理框架——Polars、DuckDB、Daft和Spark,在亚马逊S3存储的650GB Delta Lake数据集上进行了全面对比。测试聚焦于现代数据架构中的关键性能...
Read MoreNotion最新推出的《100个AI智能体应用案例指南》展示了人工智能在工作场景中的深度整合能力。该指南系统性地将AI智能体功能划分为研究分析、数据库构建、内容创作等核心模块,并针对企业常见的战略规划、客户体验优...
Read More由builddotai团队在Hugging Face平台开源的Egocentric-10K数据集,标志着工业视觉与机器人学习领域取得重大突破。该数据集包含10,000小时以第一人称视角采集的工业操作视频,涵盖192,900个视频片段,真实记录了2,138...
Read MoreMeta旗下Facebook Research团队在GitHub开源了Omnilingual ASR多语言语音识别系统,这项突破性技术首次实现对全球1600余种语言的语音转文本支持,其中数百种语言是现有ASR技术从未覆盖的濒危语种。该系统采用创新的...
Read More当前公众对软件漏洞的认知存在关键误区——传统软件的缺陷源于代码错误,可通过精确定位实现彻底修复;而AI系统的脆弱性则根植于海量训练数据,导致错误源头难以追溯或完全消除。这一差异揭示了AI安全的根本挑战:传统...
Read More近日,信息检索领域迎来突破性进展——基于生成式模型的上下文排序(ICR)技术实现规模化应用。传统ICR方法通过将任务描述、候选文档和查询直接输入大语言模型(LLM)来识别相关文档,虽效果显著但存在计算效率瓶颈:...
Read More思维机器实验室最新研究揭示了低秩适配技术(LoRA)在大语言模型微调领域的突破性表现。这项发表于权威平台的研究表明,当LoRA应用于模型所有层(尤其是MLP层)且不受数据集规模限制时,其性能可完全媲美传统全参数...
Read More