还是基于医院检查单的需求，后期会有大量的样本图片，需要分别归类去识别验证，通过程序自动分类减少下人工分类的成本，简单代码实现下。

思路

先通过百度普通OCR识别图片文字信息，对文字信息遍历，看是否有关联的关键字信息。如果识别不行，在本地的tesseract在识别一次，识别不出在统一放一个目录中，人工处理。

分类前：

分类后：

代码实现

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 
# @Time : 2022-7-8 上午 9:09 
# @Author : damon.guo 
# @File : picToClass.py 
# @Software: PyCharm
import cv2
from PIL import Image
import pytesseract
import os,sys
import shutil
from aip import AipOcr

gettaglist = ["报告单", "报告", "医院", "卫生院", "中心"]  # 识别关键字

def picToClass(picturePath):
    # imageCode = cv2.imread(r"F:\xbl\11\\12.jpg")  # 图像增强，二值化
    # picturePath=r"F:\xbl\11\\preclass\\1.jpg" # 图像增强，二值化
    image = cv2.imread(picturePath)
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    gray = cv2.GaussianBlur(gray, (5, 5), 0)
    edged = cv2.Canny(gray, 75, 200)
    tmpfilename = r"F:\xbl\11\\class\\tmp.jpg" # 临时文件
    cv2.imwrite(tmpfilename, edged)
    text = pytesseract.image_to_string(Image.open(tmpfilename), lang='chi_sim')
    print("二次识别",picturePath)
    for i in text.split("\n"):
        index = getTagIndex(i)
        if index != -1:
           news = i[:index]
           print("nes", news)
           return news.strip(" ").strip(":").strip("%")
    # 还是识别不出来，统一放一个目录
    return "other"

def getclient(APP_ID, API_KEY, SECRET_KEY):
    """ 你的 APPID AK SK """
    # APP_ID = '你的 App ID'
    # API_KEY = '你的 Api Key'
    # SECRET_KEY = '你的 Secret Key'
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    return client

def get_file_content(imagepath):
        with open(imagepath, 'rb') as fp:
            return fp.read()

def ocrsdk(imagepath):
    #先使用百度sdk识别
    client = getclient("xx", "xx", "xx")
    image = get_file_content(imagepath)
    # 必填参数
    options = {}
    # options["templateSign"] = "" # 模板id
    # options["detect_direction"] = "true" #是否自动转向
    # options["probability"] = "true" #
    options["language_type"] = "CHN_ENG"  # 识别语言
    res_image = client.basicAccurate(image,options)
    print("识别图片：",image)
    tag = baiduocrreslut(res_image)
    if tag == "other":
        # 无法识别在
        # 在本地ocr识别一次
        tag = picToClass(imagepath)
    return tag

def getTagIndex(strs):
     # 识别关键字在位置，取到索引，并向后多取2位
     for i in gettaglist:
         if i in strs:
             index = strs.index(i)
             return index+2
     return -1

def copyFile(src,dst):
    shutil.copy(src, dst)

def baiduocrreslut(res):
   # 百度识别结果解析，
    wordlist = res["words_result"]
    for w in wordlist:
        for i in gettaglist:
            if i in w["words"]:
                print(w["words"])
                if len(w["words"]) >= 4:
                    return w['words']
    return "other"

def main():

    path = r"F:\xbl\preclass" # 待分类图片目录
    classpath = r"F:\xbl\class"  # 分类后主目录
    listf = os.listdir(path)
    for i in listf:
        imagepath = os.path.join(path,i)
        tag = ocrsdk(imagepath)
        tagpath = os.path.join(classpath,tag)
        if not os.path.exists(tagpath):
            os.makedirs(tagpath)
        newimagepath = os.path.join(tagpath,i)
        if not os.path.exists(newimagepath):
            shutil.copy(imagepath,newimagepath)

if __name__ == "__main__":
    main()

相关推荐

为何越来越多的编程语言使用JSON（为什么编程）: JSON是JavascriptObjectNotation的缩写，意思是Javascript对象表示法，是一种易于人类阅读和对编程友好的文本数据传递方法，是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON（数据库用json格式存储）: 在本文中，您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?，Devops，敏捷?，测试?以及?项目?管理?最新?，最热门?的?文章?，每天?花?...

MySQL 从零开始:05 数据类型（mysql数据类型有哪些,并举例）: 前面的讲解中已经接触到了表的创建，表的创建是对字段的声明，比如：上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶（json格式对象）: 一、引言在现代Web开发中，JSON（JavaScriptObjectNotation）已经成为数据交换的标准格式。无论是从前端向后端发送数据，还是从后端接收数据，JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data（json和formdata提交区别）: 在讨论现代网络开发与API设计的语境下，理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里，特别值得关注的是两种主流数据格式：...

JSON 语法（json 语法 priority）: JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解（json的语法规则）: JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意：json的key是字符串,且必须是双引号，不能是单引号...

MySQL JSON数据类型操作（mysql的json）: 概述mysql自5.7.8版本开始，就支持了json结构的数据存储和查询，这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库，在处理json这种非结构化的数据...

JSON的数据模式（json数据格式示例）: 像XML模式一样，JSON数据格式也有Schema，这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解（后端json格式）: JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势（什么叫json）: 现在程序员还有谁不知道JSON吗？无论对于前端还是后端，JSON都是一种常见的数据格式。那么JSON到底是什么呢？JSON的定义...

PostgreSQL JSON 类型:处理结构化数据: PostgreSQL提供JSON类型，以存储结构化数据。JSON是一种开放的数据格式，可用于存储各种类型的值。什么是JSON类型？JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类（javascript 包）: JOSN:我们希望可以将一个对象在不同的语言中进行传递，以达到通信的目的，最佳方式就是将一个对象转换为字符串的形式JSON（JavaScriptObjectNotation）-JS的对象表示法...

Python数据分析只要1分钟教你玩转JSON 全程干货: Json简介：Json，全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?（json和xml哪个好）: JSON（JavaScriptObjectNotation）和XML（eXtensibleMarkupLanguage）是在日常开发中比较常用的两种数据格式，它们主要的作用就是用来进行数据的传...

python利用OCR实现图片自动分类

思路

代码实现

相关推荐

取消回复欢迎你发表评论:

Google 黑客常用搜索语句一览原力计划

npx简介（npxvip是哪国的）

在 Android 模拟器上运行 ARM 应用（android模拟器原理）

GB28181,B接口协议之SIPRTSPRTPRTMP协议从入门到精通

手机实时提取SIM卡打电话的信令和声音-辅助外设与商用通话方案

安装使用Hoppscotch构建API请求访问与测试

Python自动化办公——后台截图（python 自动截图）

轻松转换!AppleNumbers到Excel的快捷教程

电脑端腾讯文档如何导出excel

网络流媒体经典开源软件宝典webRTC, FFMpeg, SIP_流媒体开发教程

python利用OCR实现图片自动分类

思路

代码实现

相关推荐

取消回复欢迎 你 发表评论:

Google 黑客常用搜索语句一览 原力计划

npx简介（npxvip是哪国的）

在 Android 模拟器上运行 ARM 应用（android模拟器原理）

GB28181,B接口协议之SIPRTSPRTPRTMP协议从入门到精通

手机实时提取SIM卡打电话的信令和声音-辅助外设与商用通话方案

安装使用Hoppscotch构建API请求访问与测试

Python自动化办公——后台截图（python 自动截图）

轻松转换!AppleNumbers到Excel的快捷教程

电脑端腾讯文档如何导出excel

网络流媒体经典开源软件宝典webRTC, FFMpeg, SIP_流媒体开发教程

取消回复欢迎你发表评论:

Google 黑客常用搜索语句一览原力计划