Cohere最新发布的Aya项目包含3种不同规模的模型,能够使用101种语言进行对话,其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目,研究人员和开发者能够更广泛地获...
Read More近年来,大型语言模型在自然语言处理领域取得了显著进展,但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题,研究人员提出了一种新的方法:Streaming Infinite Retentive LLM(SirLLM)。这种方法允...
Read MoreMistral 公司近日在 Hugging Face Hub 上发布了其 7B 模型的最新版本——Mistral 7B Instruct V3。该版本在上下文长度和性能方面都有显著提升。新的模型不仅能够处理更长的上下文,还在多个基准测试中表现出色,显示出...
Read MoreAnthropic公司在机械解释性领域取得了重大突破,通过在Sonnet中映射数百万个概念。他们甚至发现可以通过操控这些内部概念来改变Sonnet的自我认知。例如,研究人员成功地让Sonnet相信自己是金门大桥。这个发现不仅揭...
Read More智能专家系统是一种利用大型语言模型(LLMs)进行文本分类的新方法。该系统通过减少对广泛的预处理和领域专业知识的需求,大大简化了文本分类过程。LLMs具备强大的自然语言处理能力,能够更高效地理解和分类复杂的文...
Read More近日,知名的语音识别和自然语言处理技术提供商SoundHound的AI聊天助手宣布将与Perplexity进行合作。Perplexity是一家专注于提供精准、最新的网络查询回应的公司,其技术在搜索引擎、聊天机器人等领域有着广泛应用。...
Read MoreOpenAI的GPT商店现已对所有用户开放,用户可以自由浏览和使用。OpenAI的GPT商店提供了一系列的GPT模型以供选择,包括GPT-3、GPT-2等。这些模型已被广泛应用于各种人工智能应用中,如聊天机器人、文本生成、自然语言...
Read More近日,Google发布了新的轻量级模型Gemini Flash。此模型具有多模态推理和高达一百万个符号的长上下文窗口。Google利用其先进的技术,使Gemini Flash在处理大量数据时保持了高效与精确。这种新型的轻量级模型将有助于...
Read More