模型的相关内容 - 漫话开发者

2024-02-21 talkingdev

论文：零数据训练，成功突破语音翻译难题

近日，一项名为ZeroSwot的新方法被提出，通过独特的技术，成功突破了语音和文本之间的差异以及数据缺乏等难题，实现了提高语音翻译准确度的目标。具体来说，ZeroSwot通过使用语音识别数据训练语音编码器，然后将其与...

2024-02-21 talkingdev

KV缓存的量化是Transformer架构的一个技术细节，它使其在推理时使用更少的内存。量化是在最小损失质量的情况下缩小浮点精度。

2024-02-21 talkingdev

新的SpLiCE方法使得CLIP的复杂视觉数据更易于理解。CLIP是一种先进的人工智能模型，它可以在不需要人工标注的情况下学习视觉概念。然而，由于CLIP的视觉数据非常复杂，很难解释和理解。SpLiCE通过使用可解释的特征来...

2024-02-21 talkingdev

Magic正在构建一款AI软件工程师，并获得更多资金来支持这一过程。该公司最近获得1.17亿美元的资金，以帮助开发人员自动生成代码。Magic的平台使用AI技术，可以自动完成大量编码工作，从而节省时间和减少人为错误。该...

2024-02-21 talkingdev

Google正在为Workspace客户推出“Gemini Business”和“Gemini Enterprise”计划，提供对其先进的AI模型Gemini 1.0 Ultra的访问，并提供企业级数据保护。它不会使用员工的对话进行模型训练。

2024-02-20 talkingdev

HuggingFace Hub最近发布了全新的视频模型Sora，现在提供了30篇相关的论文。这些论文包括了从模型架构到训练技巧等方面的研究，为研究人员和开发者提供了很好的参考。此外，这些论文还包括了Sora model在计算机视觉...

2024-02-20 talkingdev

Karpathy发布了一个最小化、干净、可扩展的实现字节对编码的语言模型分词器，Minbpe现已在GitHub Repo中开放。

2024-02-20 talkingdev

Qwen团队发布了两个新的语言模型，分别是1.8B和72B的LLMs，与Llama 2相似，这些模型训练了3T个标记，并且在许多任务上表现出色。除了发布聊天版本和量化版本外，这些模型还在推理、数学和代码方面表现出色。