漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-10 talkingdev

DeepSeek LLM技术报告发布:接近GPT-3.5水平

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5(即使它可能是3倍大小)。有关模型训练,令牌计数,模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器,它使用自...

Read More
2024-01-09 talkingdev

探讨如何打造具有思考能力的人工智能

本文深入探讨了如何打造一种具有人类思维过程的人工智能。在过去的几十年中,人工智能一直是计算机科学领域的一个热门话题。尽管现在已经有了许多成功的应用程序,但我们远远没有达到完全模拟人类思维过程的目标。本...

Read More
2024-01-04 talkingdev

Pykoi开源:采用RLHF提高LLMs性能

Pykoi是一个开源的Python库,旨在通过RLHF(Reinforcement Learning with Hamiltonian Flows)提高LLMs(Latent Linear Models)的性能。Pykoi是一个基于TensorFlow 2的库,提供了一系列的LLMs和RLHF的实现,可以直...

Read More
2024-01-04 talkingdev

论文:改进稳定性的单幅图像超分辨率技术

研究人员开发了一种新的方法,通过关注两个关键方面来提高单幅图像超分辨率:潜在高分辨率图像的最佳质心和影响图像质量的固有噪声。其方法还使用了一个新的深度学习框架,该框架可以显著提高超分辨率的稳定性,避免...

Read More
2023-12-25 talkingdev

开源Llama模型工具集,提高深度学习效率

Facebook发布了一组工具、资源和示例,用于使用Llama模型系列。该工具集可帮助深度学习从业人员更高效地进行模型训练和应用。Llama模型系列由Facebook AI Research开发,已被广泛用于计算机视觉领域。这个工具集将包...

Read More
2023-12-25 talkingdev

Llava多模交互模型:聊天式文本、图像输入和输出

Llava是一个强大的多模型模型。该交互式设计现在允许聊天式交错文本、图像输入和图像输出。Llava是一个深度学习模型,能够对文本和图像数据进行联合建模,并产生准确的输出。与其他模型不同的是,Llava模型不仅考虑...

Read More
2023-12-22 talkingdev

tinyzero:让任何人都能在任何环境中轻松训练类AlphaZero的智能体

由DeepMind开发的AlphaZero程序可以精通诸如国际象棋、日本象棋和围棋等游戏。现在,tinyzero可以让任何人都能轻松训练类似AlphaZero的智能体,无论是在游戏中还是在其他环境中。tinyzero是GitHub上的一个开源项目,...

Read More
2023-12-21 talkingdev

论文:利用卷积神经网络进行深度伪造检测

本研究提出了一种深度学习方法,利用四个预训练的卷积神经网络模型来识别视频中的深度伪造人脸,可实现高精度检测。深度伪造技术已成为一种严重的威胁,对政治、社会和经济稳定造成了巨大的影响。该研究提出的方法可...

Read More
  1. Prev Page
  2. 28
  3. 29
  4. 30
  5. Next Page