近日,一个庞大的工业文档OCR数据集正式发布,该数据集包含了2600万页的高质量PDF文档,总计约180亿个标记。这些文档涵盖了工业领域的广泛内容,包括机械设计、电气工程、自动化控制等多个方面。该数据集的发布,将...
Read More微软正在测试一款全新的AI驱动的Xbox聊天机器人,旨在自动化支持任务。该公司正在扩大测试范围,并将聊天机器人与Xbox的支持文档集成,以回答查询和处理游戏退款。这一举措有望提高客户服务效率,并为玩家提供更加便...
Read More普林斯顿大学的软件工程小组近日开源了一款名为“SWE-agent”的工具,该工具可以帮助开发者在GitHub上提高问题修复率。该小组在GitHub上发布了800个问题以供参考,工具通过学习这些问题并分析代码库中的代码,能够快速...
Read More微软在其广受欢迎的大型语言模型(LLMs)、向量数据库、提示技术以及低代码应用课程的基础上,发布了第二版的课程内容,现已上线GitHub。该课程共包含18课,虽然部分内容具有前瞻性,但依然是踏入该领域的良好起点。...
Read More英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新,这一更新使得AI推理速度大幅提高,达到了比基线快28倍的速度。特别是在Llama 2的基准测试中,能够达到每秒处理1200个令牌的惊人速度。这一进步得益...
Read More近期,一项名为Qwen MoE的技术引起了业界关注。该技术在保持与强大7B参数模型相当性能的同时,成功将激活参数数量减少至原来的三分之一。这一突破性的进展不仅意味着更低的计算成本,还为大规模机器学习模型的可访问...
Read More自动驾驶赛车通过在高压条件下应用人工智能和机器学习技术,正推动无人驾驶汽车技术的发展。例如,Indy Autonomous Challenge等竞赛正在加速车辆安全性方面的创新。研究者和学生利用F1tenth等平台开发算法,在实际赛...
Read MoreCoDA作为一种新的无监督领域适应(UDA)方法,通过在场景和图像两个层面学习差异,帮助AI模型更好地适应未标记的、具有挑战性的环境。CoDA的核心在于利用大量未标记数据来训练模型,使其在面对新场景时仍能保持高效...
Read More