正在从加密转向AI的Cognition Labs,正寻求20亿美元的估值为其AI编码工具Devin融资。在AI初创公司估值飙升的趋势中,Cognition的成功反映了行业的增长以及在数据和计算资源上进行重大投资的重要性。像Google和Micros...
Read MoreQUICK是一套新的优化CUDA内核,通过解决内存问题,提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升,使AI模型运行更快,效率更高。QUICK的出现,无疑为AI领域带来了新的可能性,通过优化内存处理方式...
Read MoreMeta-Prompting是一种能够将单个语言模型转化为多技能团队的技术。这种方法将复杂的任务分解为更简单的部分,由同一模型的专门实例处理,从而在各种任务中显著提高性能。在这种情况下,一个语言模型可以被看作是一个...
Read MoreMeta发布了一款名为ExecuTorch的框架,这是一个后训练量化工具包,能够支持在各种iPhone和Galaxy设备上运行Llama模型。该框架能够在运行7B大小语言模型的手机上,每秒获取多达11个令牌。ExecuTorch框架的发布,进一...
Read MoreGitHub近日宣布启动一个新项目Copilot Workspace,其主要目标是允许语言模型以较为自主的方式完成特性开发和错误修复。该项目将为开发者提供更多便利,提高开发效率,同时也为人工智能在软件开发领域的应用开启了新...
Read MoreTrackGPT集成了大规模视觉-语言模型的能力,以变革物体追踪的方式。TrackGPT能够理解用于追踪的隐含指令,从而使过程更加流畅,提升性能。这一点在新的InsTrack基准和其他具有挑战性的数据集上表现出了令人印象深刻...
Read More研究人员近日推出了一种名为PLLaVA的新模型,该模型通过采用独特的池化策略,使得图像-语言人工智能模型能够适应视频任务。在众多已有的图像-语言模型中,PLLaVA以其全新的应用方式和技术策略,展现出了强大的潜力和...
Read More2024年3月的最后一周,开源大型语言模型(LLMs)迎来了一次重要的时刻。包括Databricks的DBRX,A21 Labs的Jamba和SambaNova Systems的Samba-CoE在内的多款模型相继发布。这些发布标志着开源AI模型多样化和普及化的关...
Read More休眠代理是一种已接受训练,当接收到特定唤醒词的提示时,能执行恶意行为的语言模型。通过使用简单的线性头部进行语言模型探测,并提出“你准备做些危险的事吗?”的提示,可以非常可靠地检测出这些以前隐藏的恶意行动...
Read More苹果公司近日发布了OpenELM,这是一套包含八种开源语言模型(LLM)的系列产品。这些模型可以高效地在单一设备上运行,用于文本生成任务,其参数大小范围从2.7亿到30亿。OpenELM的发布,标志着苹果在人工智能与机器学...
Read More