漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-29 talkingdev

PLLaVA:基于独特池化策略的高质量视频生成模型

研究人员近日推出了一种名为PLLaVA的新模型,该模型通过采用独特的池化策略,使得图像-语言人工智能模型能够适应视频任务。在众多已有的图像-语言模型中,PLLaVA以其全新的应用方式和技术策略,展现出了强大的潜力和...

Read More
2024-04-29 talkingdev

论文:点对点思考的深度解析

本文展示了链式思考(CoT)可以通过'...'代币进行混淆。这需要训练模型,但表明可能无法解读CoT步骤,模型可以隐藏思考过程。链式思考是一种新兴的人工智能技术,通过模拟人类思考过程,提高机器学习模型的决策质量...

Read More
2024-04-28 talkingdev

MaxText:谷歌开源高性能机器学习模型

MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM),完全使用Python/Jax编写,目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开,充分展示了其强大的功能和优秀的性能。MaxTex...

Read More
2024-04-28 talkingdev

苹果发布开源LLM系列产品OpenELM

苹果公司近日发布了OpenELM,这是一套包含八种开源语言模型(LLM)的系列产品。这些模型可以高效地在单一设备上运行,用于文本生成任务,其参数大小范围从2.7亿到30亿。OpenELM的发布,标志着苹果在人工智能与机器学...

Read More
2024-04-28 talkingdev

Anthropic:人人可参与的智能提示库Prompt

Anthropic公司近日推出的一款新产品——智能提示库,不仅允许用户提交优化的提示,还可以让用户探索各种任务的优化提示。这一平台的目标是为广大用户提供一种轻松探索和提交优化提示的方式,以此来提高任务的执行效率...

Read More
2024-04-28 talkingdev

使用Unsloth微调Llama3:显著减少内存使用且长上下文增6倍

Llama3是一种革命性的新技术,它通过使用Unsloth进行微调,可以在保持相同的计算效率的同时,显著降低VRAM的使用量。最近的研究表明,使用Unsloth微调Llama3可以使上下文长度增长六倍,这比HF的flash attention技术...

Read More
2024-04-28 talkingdev

Sonnet AI:改变会议记录和客户关系管理的方式

Sonnet AI 是一款自动化的会议记录和客户关系管理(CRM)产品,它的主要功能是记录电话会议、制作会议记录以及管理公司与客户之间的关系。Sonnet AI 利用先进的人工智能技术,能够准确地记录和转录电话会议的内容,...

Read More
2024-04-28 talkingdev

论文:利用图神经网络预测器优化神经架构搜索

在神经架构搜索(NAS)的创新工作中,引入了一种图神经网络(GNN)预测器,这种预测器可以提高识别特定任务的最优神经网络配置的效率。GNN预测器通过理解神经网络的图结构,从而可以更有效地预测神经网络的性能,这...

Read More
  1. Prev Page
  2. 106
  3. 107
  4. 108
  5. Next Page