漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-08 talkingdev

苹果公司将在WWDC上推出一系列基于生成式AI的新工具

据报道,作为iOS 18的一部分,苹果计划在WWDC上宣布一系列基于生成式AI的新工具。这些新工具将包括Siri的改进版本、Xcode的新版本以及Apple Music中用于自动创建播放列表的工具。该技术还将用于解决AppleCare的问题...

Read More
2024-01-04 talkingdev

Pykoi开源:采用RLHF提高LLMs性能

Pykoi是一个开源的Python库,旨在通过RLHF(Reinforcement Learning with Hamiltonian Flows)提高LLMs(Latent Linear Models)的性能。Pykoi是一个基于TensorFlow 2的库,提供了一系列的LLMs和RLHF的实现,可以直...

Read More
2024-01-03 talkingdev

揭示Gemini的潜力:多模态常识推理研究

本项目介绍了对Google的Gemini进行深入分析的研究,Gemini是一种多模态大型语言模型,评估其在各种任务中的常识推理性能。该研究与其他模型进行了比较,揭示了其在跨模态知识整合方面的竞争能力。

Read More
2023-12-25 talkingdev

OpenAI新设安全咨询小组,并授权董事会对高风险AI模型进行否决权

OpenAI成立了一个新的安全咨询小组,并授权董事会对所有模型进行否决权。OpenAI是一个由伊隆·马斯克等人创建的人工智能研究组织,致力于通过开发先进的AI技术,推进人工智能的发展和应用。在新的安全咨询小组中,来...

Read More
2023-12-22 talkingdev

WhisperPlus,高质量语音转文字技术开源

近日,WhisperPlus正式发布。据悉,该开源项目采用了先进的语音转文字处理技术,能够实现高质量、高准确性的语音转文字功能。此外,该项目还支持多种语言和方言,可广泛应用于语音转写、智能客服等领域。WhisperPlus...

Read More
2023-12-22 talkingdev

谷歌公布850+人联合论文,阐述Gemini语言模型的研究成果

Google的Gemini语言模型项目已经发表了一篇850多位作者的论文。该论文详细阐述了Gemini语言模型的研究成果,但缺乏关键的架构和数据集细节。该论文还提供了有关归因和评估的详细信息。

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-12-21 talkingdev

VideoPoet:谷歌语言模型在视频创作中大放异彩

Google的VideoPoet是一种开创性的语言模型,它在处理文本到视频,视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...

Read More
  1. Prev Page
  2. 61
  3. 62
  4. 63
  5. Next Page