漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-17 talkingdev

Insanely Fast Whisper: 使用OpenAI模型,300分钟音频转录不到10分钟

Insanely Fast Whisper是一个使用OpenAI的Whisper Large v2模型的音频转录工具,它可以在不到10分钟的时间内转录300分钟的音频。该工具快速且易于使用,同时可提供基准测试结果。

Read More
2023-10-16 talkingdev

Hugging Face发布Mistral模型,重点优化聊天表现

Hugging Face团队通过直接优化偏好进行训练,推出了Mistral模型,该模型在各种基准测试中提高了聊天表现。

Read More
2023-10-16 talkingdev

minidalle3,提高LLMs的文本到图像生成技术

研究人员正在改进我们与文本到图像模型的交互方式,例如Midjourney和Stable Diffusion,这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”,使人们可以自然地与大型语言模型进行交互,以获得更...

Read More
2023-10-16 talkingdev

ScaleCrafter: 高分辨率图像生成技术开源

研究人员使用预训练的扩散模型在较小的图像上进行训练,以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题,并将问题指向了模型结构的有限感知能力。

Read More
2023-10-16 talkingdev

AI 2023:语言模型的行业现状

本文对语言模型行业进行了全面总结。其中对于安全性、能力、芯片等方面进行了深入讨论。值得一提的是,关于人工智能电影制作、资本成本和人工智能推动的IPO的预测也十分有趣。

Read More
2023-10-16 talkingdev

OpenAI发布更新,提高AI开发效率

OpenAI计划在其开发人员工具中引入诸如内存存储和先进的视觉功能等更新,以显著降低应用程序成本,并促进各个领域的创新。 OpenAI的目标是使AI开发更加高效和可靠,以实现AI技术的广泛应用。随着这些新功能的引入,...

Read More
2023-10-16 talkingdev

Anyscale-将Llama 2的冷启动时间缩短至30秒

模型从云存储加载到节点GPU通常需要大部分推理时间。通过一些巧妙的技巧,例如内存流,Anyscale将其缩短了20倍,仅需30秒即可到达Llama 2 70B。

Read More
2023-10-13 talkingdev

GPT-4的推理能力已被充分证明

尽管GPT-4缺乏意识和长期记忆,但有充分的证据表明它能够推理和理解概念。GPT-4是人工智能领域中最先进的语言模型,它可以生成高质量的自然语言文本。尽管它缺少人类的智能,但它可以在多个领域表现出惊人的表现力。...

Read More
  1. Prev Page
  2. 352
  3. 353
  4. 354
  5. Next Page