模型的相关内容 - 漫话开发者

2024-06-12 talkingdev

PHATGOOSE：增强零样本学习的新方法

PHATGOOSE是一种显著提高AI在没有先前暴露的情况下概括和学习新任务能力的方法。这种方法通过智能地在不同专业的语言模型之间进行路由，以完成任务的各个部分。零样本学习是一种让机器学习模型在没有见过任何训练样...

2024-06-12 talkingdev

当前，大多数用于Transformers的计算花费在线性层上。这项工作利用muP和Monarch矩阵构建了一个结构化表示，不仅减少了计算量，而且比原始的密集层拥有更好的扩展规则。这项技术可以提高计算效率，降低运算成本，为AI...

2024-06-12 talkingdev

Coqui.ai TTS是一款用于文本转语音的深度学习工具包，它支持多种语言和声音风格，并可在较低的计算资源上实现高质量的语音合成。该工具包基于TensorFlow 2和PyTorch，是一款开源、易于使用的工具，可帮助研究人员和...

2024-06-11 talkingdev

苹果在全球开发者大会（WWDC）的主题演讲中宣布了一系列AI特性和其操作系统的重大更新。其中，Apple的AI系统Apple Intelligence将为iPhone、iPad和Mac带来强大的生成模型，作为核心功能。这将使Apple的原生应用程序...

2024-06-09 talkingdev

在自然语言处理（NLP）中，分块是指将句子分成更小的组块（块）的过程，每个块都有自己的语法和含义。在RAG（Retrieval-Augmented Generation）应用程序中，分块是生成响应的重要步骤。不同于传统的基于规则或基于统...

2024-06-07 talkingdev

阿里云最新发布的旗舰语言模型Qwen 2在基准性能测试中略超越了Llama 3 70B，成为新一代语言模型的标杆。Qwen 2不仅在英语性能方面表现卓越，同时也是一个更优秀的多语言模型。这一突破性进展标志着阿里云在人工智能...

2024-06-07 talkingdev

Together AI团队发布了一款名为DragonFly Vision的全新视觉语言模型（VLM）。该模型因其高效的架构在处理极高分辨率图像方面表现卓越。DragonFly Vision采用了一系列先进的技术，包括深度学习和神经网络优化，从而实...

2024-06-07 talkingdev

OpenAI团队在其最新的GPT-4模型中发现了1600万个可解释特征，包括价格变动、代数环以及谁/什么对应关系。这一发现大大推进了大规模SAE（自注意解释性）研究的进程。为了让研究人员和开发者更好地理解和利用这些特征...