瑞芯微RV1126B开发板（EASY-EAI-PI2） OCR文字识别

发布时间：2026/7/2 4:58:23

1. OCR文字识别简介文字识别也是图像领域一个常见问题。然而对于自然场景图像首先要定位图像中的文字位置然后才能进行文字的识别。所以一般包含两个步骤文字检测解决的问题是哪里有文字文字的范围有多少。文字识别对定位好的文字区域进行识别主要解决的问题是每个文字是什么将图像中的文字区域进转化为字符信息。我们的OCR算法是基于CTPNCRNN设计的。CTPN是一种文字检测算法能有效的检测出复杂场景的横向分布的文字是目前比较好的文字检测算法。CRNN算法主要用于端到端地对不定长的文本序列进行识别不用先对单个文字进行切割而是将文本识别转化为时序依赖的序列学习问题就是基于图像的序列识别。基于EASY-EAI-PI2硬件主板的运行效率2. 快速上手2.1 开发环境准备如果您初次阅读此文档请阅读《入门指南/开发环境准备/Easy-Eai编译环境准备与更新》并按照其相关的操作进行编译环境的部署。在PC端Ubuntu系统中执行run脚本进入EASY-EAI编译环境具体如下所示。cd ~/develop_environment ./run.sh 22042.2 源码下载在EASY-EAI编译环境下创建存放源码仓库的管理目录cd /opt mkdir EASY-EAI-Toolkit cd EASY-EAI-Toolkit通过git工具在管理目录内克隆远程仓库git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-1126B.git注* 此处可能会因网络原因造成卡顿请耐心等待。* 如果实在要在gitHub网页上下载也要把整个仓库下载下来不能单独下载本实例对应的目录。2.3 模型部署要完成算法Demo的执行需要先下载OCR算法模型。百度网盘链接为https://pan.baidu.com/s/1imI86u1O9xH6T6V_0k2jxw?pwd1234 提取码1234 。同时需要把下载的OCR算法模型复制粘贴到Release/目录2.4 例程编译进入到对应的例程目录执行编译操作具体命令如下所示cd EASY-EAI-Toolkit-1126B/Demos/algorithm-ocr/ ./build.sh cpres注* 由于依赖库部署在板卡上因此交叉编译过程中必须保持/mnt挂载。* 若build.sh脚本带有cpres参数则会把Release/目录下的所有资源都拷贝到开发板上。2.5 例程运行及效果通过串口调试或ssh调试进入板卡后台定位到例程部署的位置如下所示cd /userdata/Demo/algorithm-ocr/运行例程命令如下所示sudo ./test-ocr test.jpg在EASY-EAI编译环境可以取回测试图片:cp /mnt/userdata/Demo/algorithm-ocr/result.jpg .结果图片如下所示API的详细说明以及API的调用本例程源码详细信息见下方说明。3. OCR文字识别API说明3.1 引用方式为方便客户在本地工程中直接调用我们的EASY EAI api库此处列出工程中需要链接的库以及头文件等方便用户直接添加。3.2 OCR检测初始化函数设置OCR检测初始化函数原型如下所示。int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);具体介绍如下所示。3.3 OCR检测运行函数设置OCR检测运行原型如下所示。int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);复制具体介绍如下所示。3.4 OCR检测释放函数设置OCR检测释放原型如下所示。int ocr_det_release(rknn_app_context_t* app_ctx);具体介绍如下所示。3.5 OCR识别初始化函数OCR识别初始化函数原型如下所示。int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);具体介绍如下所示。3.6 OCR识别运行函数OCR识别运行函数原型如下所示。int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);具体介绍如下所示。3.7 OCR识别释放函数OCR识别释放函数原型如下所示。int ocr_rec_release(rknn_app_context_t* app_ctx);具体介绍如下所示。4. OCR检测算法例程例程目录为Demos/algorithm-ocr/test-ocr.cpp操作流程如下。#include opencv2/opencv.hpp #include stdio.h #include sys/time.h #includeocr.h using namespace cv; using namespace std; #define INDENT #define THRESHOLD 0.3 // pixel score threshold #define BOX_THRESHOLD 0.9 // box score threshold #define USE_DILATION false // whether to do dilation, true or false #define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type int main(int argc, char **argv) { if (argc ! 2) { printf(%s image_path\n, argv[0]); return -1; } /* 参数初始化 */ const char *img_path argv[1]; Mat input_image, rgb_img; input_image imread(img_path); if (input_image.empty()) { cout Error: Could not load image endl; return -1; } cv::cvtColor(input_image, rgb_img, COLOR_BGR2RGB); rknn_app_context_t ocr_det_ctx, ocr_rec_ctx; memset(ocr_det_ctx, 0, sizeof(rknn_app_context_t)); memset(ocr_rec_ctx, 0, sizeof(rknn_app_context_t)); /* OCR算法检测模型识别模型初始化 */ ocr_det_init(ocr-det.model, ocr_det_ctx); ocr_rec_init(ocr-rec.model, ocr_rec_ctx); struct timeval start; struct timeval end; float time_use0; /* OCR算法检测模型运行 */ ocr_det_result results; ocr_det_postprocess_params params; params.threshold THRESHOLD; params.box_threshold BOX_THRESHOLD; params.use_dilate USE_DILATION; params.db_score_mode (char*)slow; params.db_box_type (char*)poly; params.db_unclip_ratio DB_UNCLIP_RATIO; gettimeofday(start,NULL); int ret; ret ocr_det_run(ocr_det_ctx, rgb_img, params, results); if (ret ! 0) { printf(inference_ppocr_rec_model fail! ret%d\n, ret); } gettimeofday(end,NULL); time_use(end.tv_sec-start.tv_sec)*1000000(end.tv_usec-start.tv_usec);//微秒 printf(time_use is %f\n,time_use/1000); /* 截取文字信息和画框 */ printf(DRAWING OBJECT\n); for (int i 0; i results.count; i) { printf([%d]: [(%d, %d), (%d, %d), (%d, %d), (%d, %d)] %f\n, i, results.box[i].left_top.x, results.box[i].left_top.y, results.box[i].right_top.x, results.box[i].right_top.y, results.box[i].right_bottom.x, results.box[i].right_bottom.y, results.box[i].left_bottom.x, results.box[i].left_bottom.y, results.box[i].score); line(input_image, Point(results.box[i].left_top.x, results.box[i].left_top.y), Point(results.box[i].right_top.x, results.box[i].right_top.y), Scalar(0, 255, 0), 1, LINE_AA); line(input_image, Point(results.box[i].right_top.x, results.box[i].right_top.y), Point(results.box[i].right_bottom.x, results.box[i].right_bottom.y), Scalar(0, 255, 0), 1, LINE_AA); line(input_image, Point(results.box[i].right_bottom.x, results.box[i].right_bottom.y), Point(results.box[i].left_bottom.x, results.box[i].left_bottom.y), Scalar(0, 255, 0), 1, LINE_AA); line(input_image, Point(results.box[i].left_bottom.x, results.box[i].left_bottom.y), Point(results.box[i].left_top.x, results.box[i].left_top.y), Scalar(0, 255, 0), 1, LINE_AA); cv::Mat rgb_crop_image GetRotateCropImage(rgb_img, results.box[i]); /* OCR算法识别模型运行 */ ocr_rec_result rec_results; ocr_rec_run(ocr_rec_ctx, rgb_crop_image, rec_results); // print text result printf(regconize result: %s, score%f\n, rec_results.str, rec_results.score); } cv::imwrite(result.jpg, input_image); return 0; }

资讯详情

瑞芯微RV1126B开发板（EASY-EAI-PI2） OCR文字识别

相关新闻

技术Leader备考PMP：从交付实践到方法论的4个关键转换

大模型量化-rr

职场人迈入 35 岁别再盲目内卷！提前做好职业长期布局规划，避开中年危机实现稳步增值

5个你绝对不知道的明日方舟自动化技巧：MAA智能助手深度解析

慢智能：AI的优雅减速时代

个人网站恶意流量防御实战：从监控到架构的四层防护体系

《我的机器人女友：代号夜莺》

基于增强混沌映射与改进重力扩散的图像加密算法实现与评估

性价比高的门禁卡哪个颜色好

BurpSuite Cluster Bomb模式深度避坑指南：从原理到实战的完整爆破策略

Selenium元素定位全解析：从八大方法到实战策略

移动端UI自动化测试框架Maestro终极指南：从入门到实战

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

棋牌室茶楼收银别只看价格：京东收银K6收银机为什么值得小店老板优先了解

基于Dify与DeepSeek构建私有知识库问答系统实战指南

FAE放射组学分析工具：医学影像特征探索的完整解决方案

DesktopNaotu：你的终极离线思维导图解决方案，告别网络依赖！