MiniCPM-V可以在手机本地运行的AI大模型

我最近发现一个很有意思的AI项目——MiniCPM-V，可以说它将AI技术的应用推向了一个全新的高度，让我们能够将GPT-4V级的多模态大模型直接部署在我们的手机上，而且完全不需要联网，真正的手机本地玩AI大模型，万物皆可AI！（以下美图，与题目无关，纯粹养眼）

MiniCPM-V的核心亮点

1. 强大的图像处理能力

MiniCPM-V不仅仅是一个文本生成模型，它还侧重于图像处理。只需提供一张图片和一些文本指示，MiniCPM-V就能迅速分析并生成相关内容。无论是将图片内容转化为Markdown格式，还是深入解析图中细节，MiniCPM-V都能以惊人的速度和准确性完成。

2. 超级优秀的OCR能力

这款模型在OCR（光学字符识别）领域表现尤为出色。在OCR的性能测试中，MiniCPM-V可以处理高达180万像素的图像，并且在OCRBench的测试中得分高达725分，超越了许多知名的商用闭源模型，如GPT-4o和Gemini Pro。

3. 多模态行为的可靠性

得益于最新的RLAIF-V对齐技术，MiniCPM-V的多模态行为更加可靠，其幻觉率显著低于其他模型，位列开源模型之首。

手把手教你体验

MiniCPM-V兼容Windows、Mac以及Android设备，无论你使用什么设备，都可以享受到本地部署的便捷。对于Android用户，体验这一神奇的AI模型更加简单，我又出手了，手把手带你快速体验：

①下载并安装MiniCPM 1.2B和MiniCPM-V 2.0的APK文件

②授予相应的相机和照片权限

适用于可以处理多模型输入（文本+图像）。

③下载模型并等待初始化完成

– 按下载按钮

– 等待进度条填满：下载非常迅速的，几分钟就能下好。

– 开始聊天

注意：由于下载存在bug，目前两个模型无法同时下载。

④启动聊天功能，体验在手机本地与AI互动聊天。下图是我亲测的，用安卓手机在本地跟MiniCPM-V聊天，反应非常迅速，等于你在手机端就能拥有一个超级聪明的AI助手！

相关文章