谷歌推出了Gemini 1.5,开发者和企业用户可以提前体验,而消费者版的全面推出还需要等待。新版Gemini的性能高端,与谷歌最近推出的高端Gemini Ultra相媲美。Gemini 1.5采用了专家混合技术,使得模型对于用户而言更快...
Read More亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities(BASE TTS),该模型拥有980万个参数,并具有新兴特性,可以自然地讲述甚至是复杂的句子。该模型是当前最大的...
Read MoreShortwave发布了一个基于人工智能的自动补全功能,类似于GitHub Copilot,但专门为撰写电子邮件而设计。它从发送的电子邮件中学习,并提供上下文建议。
Read More研究人员开发了BriVIS,一种改进开放词汇视频实例分割(VIS)的方法。通过使用一种称为布朗运动桥的技术,BriVIS保持了物体运动在视频帧之间的上下文,从而实现了更准确的视频和文本对齐。
Read More近日,GitHub开源了一项名为FILCO的技术,旨在通过上下文过滤来提高人工智能系统的性能,特别是在回答问题和核查事实等领域。该技术的工作原理是选择最有用的信息,并训练模型来过滤掉不相关的细节。相比传统的人工...
Read More研究人员开发了一种名为CAINet的新方法来改进RGB-T语义分割技术,这对于无人驾驶至关重要。该系统独特地结合了不同类型的数据,注重它们的互补性和全局上下文。CAINet使用了一个基于注意力机制的自适应特征融合模块...
Read More谷歌推出了Gemini Pro,这是其先进的AI模型Gemini Ultra的轻量级版本,在Vertex AI中公开预览,提供文本和图像处理能力以及可定制的上下文,适用于各种用例。Gemini Pro是一个快速而灵活的解决方案,可以自定义模型...
Read More微软的最新模型现已在HuggingFace上提供研究用途。Phi-2是一种基于Transformers的语言生成模型,它被训练用于生成各种文本,包括问答、对话和自然语言生成。该模型采用的是自回归模式,即在生成下一个单词或字符时,...
Read More