OpenAI和Google已经推出了先进的AI模型,能够实现实时的多模式理解和响应,带来了AI助手和语音代理的创新。OpenAI的GPT-4o以其前代的两倍速度和一半成本引发了关注,而Google的Gemini 1.5 Flash实现了显著的延迟和成...
Read More微软最近发布了一套名为Florence-2的MIT许可的小型视觉语言模型(VLMs)。这套模型在图像标注、边界识别和分类等任务上,表现出色,大大超过了许多体型更大的模型。Florence-2模型的发布,标志着微软在人工智能和机...
Read MoreRoblox正在构建向4D生成AI的技术,这一技术超越了单一的3D对象,实现了动态交互。解决4D的挑战将需要在外观、形状、物理和脚本等多个方面进行深度理解。早期为4D系统打下基础的工具已经在平台上加速了创新的步伐。Ro...
Read More苹果在其全球开发者大会(WWDC)上揭示了其在AI领域的战略定位,重点关注隐私和安全,并在其私有云中使用自家芯片和零信任架构。苹果的AI整合了OpenAI的ChatGPT,用于超出其范围的任务,其商业模式可能让AI供应商为...
Read MoreIlya Sutskever近日成立了Safe Superintelligence Inc. (SSI)。这是一家专注于开发安全且强大的人工智能系统的创业公司。此公司的主要目标是开发出可以在没有商业压力影响下运行的AI系统。因此,SSI的成立被看作是对...
Read MoreDecagon正在为客户支持构建人性化的AI Agent。该公司近期从Accel获得了3000万美元的A轮融资,并从a16z获得了500万美元的种子轮融资。Decagon的产品为Eventbrite、Rippling、Webflow、BILT和Substack等公司提供全球支...
Read More蜥蜴(Chameleon)是一个早期融合模型,它能同时操作图像和文本标记。其团队几周前发布了这篇论文。现在,他们已经发布了模型检查点以及推理代码。这一模型的发布,标志着图像和文本融合技术的新进展,同时,它的开...
Read More近日,一款名为Shpool的轻量级Tmux替代方案首次亮相。Shpool是一款基于Go语言开发的跨平台终端复用工具,通过提供类似Tmux的会话和窗口管理功能,帮助用户更加高效地使用终端。 Shpool支持多种终端模拟器,如xterm、...
Read More