漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-07 talkingdev

阿里Qwen 1.5多语言模型发布

Qwen 1.5模型发布,参数从0.5B到72B,是一套令人印象深刻的多语言模型。有趣的是,最小的模型是第一个严肃的小于10亿参数的语言模型

Read More
2024-02-06 talkingdev

论文:AI技术在音频质量评估中的应用

近日,研究人员开发出了一种名为PAM的工具,它使用音频语言模型对音频质量进行评估,无需参考曲目或专业培训。PAM通过深度学习算法,将音频数据转化为分布式表示形式,并将其与质量分数进行关联。据研究人员介绍,PA...

Read More
2024-02-06 talkingdev

论文:提升效率的推荐系统

PAP-REC提出了一种自动创建个性化提示的推荐语言模型的方法,增强了它们的效率和效果。该方法基于用户的历史行为和偏好,并且能够自动识别关键字和短语,以生成更准确的推荐。同时,该方法能够在不增加额外计算成本...

Read More
2024-02-06 talkingdev

自然语言SQL-7B模型现身,强大的文本转SQL模型

最近,谷歌AI团队发布了一篇论文,介绍了他们新开发的自然语言SQL-7B模型。这一模型使用了一种名为T5的预训练语言模型。这种模型可以将人类语言转换为SQL查询。自然语言SQL-7B模型是目前最强大的文本转SQL模型之一,...

Read More
2024-02-05 talkingdev

AI2发布全面开放的开放语言模型OLMo

AI2发布了一个完全开放的语言模型训练框架,名为OLMo。该模型提供全面的资源,包括完整的训练数据、模型权重、训练和评估代码、每个模型超过500个检查点,以及未来的微调代码,所有这些都遵循Apache 2.0许可证。这些...

Read More
2024-02-02 talkingdev

AlphaGo中的MCTS搜索算法实现

Monte Carlo Tree Search (MCTS)是一种先进的搜索算法。它被用于AlphaGo中,研究人员现在正在努力将其与语言模型集成。MCTS的实现一直以来都非常棘手,但是Jax的出现使得它变得更为容易。现在,开发者们可以在GitHub...

Read More
2024-02-02 talkingdev

Llava 1.6发布,OCR、推理和世界知识得到改进

Llava是一种视觉语言模型,最新版本为1.6,经过改进后,其OCR、推理和世界知识等方面有了很大提升,甚至在某些任务上可以与Gemini相媲美。Llava团队计划发布数据、代码和模型,以便更多人能够使用。

Read More
2024-02-02 talkingdev

微软利用激光技术解决LLM幻觉问题

1月份微软研究论坛上,Dipendra Misra提出了一种名为“Layer-Selective Rank Reduction(LASER)”的技术,通过用一个较小的近似矩阵替换权重矩阵,提高了大型语言模型(LLM)的准确性。

Read More
  1. Prev Page
  2. 81
  3. 82
  4. 83
  5. Next Page