模型的相关内容 - 漫话开发者

2023-12-15 talkingdev

Google推出Imagen2，提供文本和标志生成功能

Google推出了Imagen 2，这是一种增强的AI图像模型，可供经批准的Google Cloud Vertex AI用户使用，提供文本渲染，标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...

2023-12-15 talkingdev

FunSearch是一种人工智能系统，可以与特别训练的大型语言模型进行交互，创建生成数学问题解决方案的计算机程序。该系统会检查这些解决方案是否优于已知的解决方案，如果不是，它会向LLM提供反馈，以便下一轮改进。它...

2023-12-13 talkingdev

近期，Triton手写常见模型梯度加速 AI 训练的项目备受关注。该项目手写了一些常见模型的梯度，以加速训练过程。尽管该项目的基准测试结果并不是最具说服力的，但这是一项非常值得尝试的努力。根据测试结果，该项目能...

2023-12-13 talkingdev

近日，HuggingFace 发布了最新版本的 Transformers 4.36.0。此次更新新增了 Mistral 模型和 AMD 支持等多项功能。同时，safetensors 已成为默认设置。HuggingFace 的这次更新将为 AI 模型的开发和训练提供更加便利的...

2023-12-13 talkingdev

本项目深入探讨了使用无监督模型在真实世界图像中分割目标的困难。目前，无监督分割技术仍存在一些挑战。首先，图像中的目标可能具有不同的形状和大小，需要针对不同特征进行分割。其次，图像中可能存在噪声、光照变...

2023-12-13 talkingdev

KwaiAgents是一个先进的代理系统，使用大型语言模型来模仿人类认知技能。该系统可以应用于自然语言处理、语音识别等领域。KwaiAgents的开放源代码已经上传至GitHub平台，使得更多的研究人员可以参与到该项目中来。该...

2023-12-13 talkingdev

近日，研究人员开发出了一种专门为生物应用设计的视觉模型BioCLIP。实验结果显示，在特定的生物任务上，BioCLIP的表现比OpenAI的clip高出近20%。此外，BioCLIP还提供了一个由1千万对图像和文本构成的训练集。事实...

2023-12-13 talkingdev

空间-时间多样化网络（STDN）是一种新型模型，通过探索帧内的空间特征和时间上的关联关系来捕捉视频中的多种线索。STDN模型可以同时捕捉视频中的动作、外观、场景和对象等多种信息，从而实现更准确的视频分类。此技...