近日,DriveLMM-o1项目发布了一款全新的数据集和基准测试,旨在提升自动驾驶系统中逐步视觉推理的准确性和决策能力。该数据集通过模拟复杂的驾驶场景,为人工智能驱动的自动驾驶技术提供了更加精细的视觉推理支持。D...
Read MoreFunsearch是一种基于大型语言模型(LLM)驱动的遗传算法新实现,旨在帮助数学家解决组合和数论问题,而无需具备机器学习的专业知识。这项创新技术通过结合遗传算法的优化能力与LLM的生成能力,为数学研究提供了全新...
Read More近日,一项技术突破使得普通蓝牙设备能够模拟Apple AirTag的功能,且无需root权限。这一创新为开发者提供了新的可能性,使得更多设备能够实现类似AirTag的定位和追踪功能。通过利用现有的蓝牙技术,开发者可以轻松地...
Read More近日,EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相,旨在评估多模态大语言模型(MLLMs)在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务,这对模型的感知、推理和执行能力提...
Read More近日,Browser Use (YC W25) 宣布推出其开源项目——Web Agents,旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术,能够模拟人类在网页上的操作行为,如点击、滚动、填写表单等。通...
Read More近日,科学家们成功绘制了黑洞内部混沌时空的新地图,这一突破性研究为我们理解黑洞内部的极端物理环境提供了新的视角。通过先进的数学模型和计算机模拟,研究人员揭示了黑洞内部时空的复杂结构和动态变化。这些新地...
Read More近日,一项创新的研究展示了使用3D Gaussian Splats渲染的逼真环境来训练端到端驾驶强化学习(RL)模型的潜力。该研究通过构建高度真实的虚拟驾驶场景,显著提升了模型的训练效果。实验结果表明,与传统方法相比,采...
Read More蛋白质设计的终极目标之一是从无到有地构建全新的酶。传统上,科学家通过在自然界中发现酶,然后通过试错方法对它们进行改进和适应。AI的最新进展可能最终引领我们从头开始创建定制酶的道路,但这一过程仍然是一个巨...
Read More