模型的相关内容 - 漫话开发者

2024-05-23 talkingdev

MiniCMP-V开源新版本，可在手机上处理视觉任务

近日，MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色，甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言，还在光学字符识别（OCR）和视觉问答（visual quest...

2024-05-23 talkingdev

研究人员开发了一种名为Wav-KAN的神经网络框架，该框架采用小波函数来提升模型的可解释性和性能。与传统模型不同，Wav-KAN能够同时捕捉高频和低频数据成分，从而实现更快的训练速度和更高的稳健性。这一创新方法不仅...

2024-05-23 talkingdev

MathBench是一项旨在全面评估大语言模型数学能力的新基准。这一基准的设计初衷是为了填补当前评估工具在数学领域的空白，提供一个更加系统化和科学化的评估方法。MathBench不仅涵盖了基础数学运算，还包括高级数学理...

2024-05-23 talkingdev

微软近日宣布，他们已成功训练出一款名为Aurora的大气预测基础模型。该模型在全球天气预测测试中，分别在5天和10天的预测准确性上，创下了新的记录。Aurora模型通过先进的机器学习算法和大量的气象数据进行训练，能...

2024-05-23 talkingdev

微软正式发布了其Phi-3模型，并推出了Phi-3-Silica，这是一款专为Copilot+ PC中的神经处理单元优化的小型语言模型。Phi-3-Silica拥有33亿参数，能够在低功耗的情况下提供快速的本地推理。这标志着在Windows设备中直...

2024-05-23 talkingdev

斯坦福大学人类中心人工智能研究院（Stanford HAI）发布了最新版本的基础模型透明度指数，对包括OpenAI和Google在内的14家主要人工智能开发商的透明度进行了评估。这些公司披露了之前未向公众公开的新信息，标志着在...

2024-05-22 talkingdev

Braindump是一款革命性的AI工具，它允许开发者通过简单的文本提示来构建俯视视角/2.5D游戏或交互式虚拟世界。这项技术可以自动生成3D模型、游戏数据和脚本，从而将用户的创意构想转化为生动的游戏内容。本文总结了Br...

2024-05-22 talkingdev

DeepSeek-VL 是一个专注于现实世界应用的全新开源视觉语言模型。该模型特别针对多样化的数据进行了优化，包括来自网页截图、图表以及 OCR（光学字符识别）数据的处理。DeepSeek-VL 的设计目标是提高在复杂和多样化数...