百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

使用Keras搭建卷积神经网络进行手写识别的入门(包含代码解读)

toyiye 2024-07-09 22:47 10 浏览 0 评论

本文是发在Medium上的一篇博客:《Handwritten Equation Solver using Convolutional Neural Network》。本文是原文的翻译。这篇文章主要教大家如何使用keras训练手写字符的识别,并保存训练好的模型到本地,以及未来如何调用保存到模型来预测。本文对一些不太明确的地方做了一点小注释。论文使用了cv2的包做预处理,并使用keras搭建了卷积网络。

主要目录如下

  • 介绍
  • 获取训练数据
  • 1.下载数据集
  • 2.抽取特征
  • 使用卷积神经网络训练数据
  • 1.构建卷积神经网络
  • 2.将模型拟合到数据
  • 测试模型

介绍

随着技术的进步,机器学习和深度学习在当今时代起着至关重要的作用。现在,机器学习和深度学习技术正被用于手写识别,机器人技术,人工智能以及更多领域。开发此类系统需要使用数据训练我们的机器,使其能够学习并进行必要的预测。本文介绍了一种手写方程求解器,通过手写数字和数学符号训练,使用卷积神经网络和一些图像处理技术,实现98.46%的精度。

获取训练数据

1.下载数据集

我们可以从这个链接下载数据集。解压缩zip文件。不同的文件夹包含不同数学符号的图像。为简单起见,我们在本次学习中仅仅使用0-9数字图像,以及“+”、“-”和“×”三个符号图像。在观察我们的数据集时,我们可以看到它对某些数字/符号有偏差,因为某些符号包含了12000个图像,但是其他符号只包含了3000个图像。要消除此偏差,请将每个文件夹中的图像数量减少到约 4000左右。

2.抽取特征

我们可以使用轮廓提取(contour extraction)技术来获得特征(注意,这里作者并没有明确说明轮廓提取的方法,其实源代码中主要使用cv2的包来获取图片的轮廓)。主要步骤包括:

  1. 反转图像然后将其转换为二进制图像,因为当对象为白色且周围为黑色时,轮廓提取会产生最佳结果。
  2. 要查找轮廓,请使用“findContour”功能。对于特征,我们使用’boundingRect’函数获得轮廓的边界矩形(边界矩形是包围整个轮廓的最小水平矩形)。
  3. 由于数据集中的每个图像只包含一个符号/数字,因此我们只需要最大尺寸的边界矩形。为此,我们计算每个轮廓的边界矩形的面积,并选择具有最大面积的矩形。
  4. 现在,将最大区域边界矩形的大小调整为28乘以28,然后压平,变成784乘以1。因此,现在将有784像素值或特征。现在,给它相应的标签(例如,对于0-9图像与其数字相同的标签,对于 - 指定标签10,对于+指定标签11,“×”指定标签12)。所以现在我们的数据集包含784个特征列和一个标签列。提取特征后,将数据保存为CSV文件。

原文没有任何代码,我从他的Github上找到了相关代码,供大家参考。主要代码包括:

def load_images_from_folder(folder):
 train_data=[]
 for filename in os.listdir(folder):
 img = cv2.imread(os.path.join(folder,filename),cv2.IMREAD_GRAYSCALE)
 img=~img
 if img is not None:
 # 这个方法主要是像素高于阈值时,给像素赋予新值,否则,赋予另外一种颜色,这个操作是为了让轮廓提取效果更好
 ret,thresh=cv2.threshold(img,127,255,cv2.THRESH_BINARY)
# 这个方法就是提取轮廓
ret,ctrs,ret=cv2.findContours(thresh,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE)
 cnt=sorted(ctrs, key=lambda ctr: cv2.boundingRect(ctr)[0])
 w=int(28)
 h=int(28)
 maxi=0
 for c in cnt:
 x,y,w,h=cv2.boundingRect(c)
 maxi=max(w*h,maxi)
 if maxi==w*h:
 x_max=x
 y_max=y
 w_max=w
 h_max=h
 im_crop= thresh[y_max:y_max+h_max+10, x_max:x_max+w_max+10]
 im_resize = cv2.resize(im_crop,(28,28))
 im_resize=np.reshape(im_resize,(784,1))
 train_data.append(im_resize)
 return train_data

使用卷积神经网络训练数据

由于卷积神经网络在二维数据上工作,我们的数据集是785乘1的形式。因此,我们需要重塑它。 首先,将数据集中的标签列分配给变量y_train。 然后从数据集中删除标签列,然后将数据集重新变成28乘28.现在,我们的数据集已准备好用于CNN。

1.构建卷积神经网络

要制作CNN,请导入所有必需的库。

import pandas as pd
import numpy as np
import pickle
np.random.seed(1212)
import keras
from keras.models import Model
from keras.layers import *
from keras import optimizers
from keras.layers import Input, Dense
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import Flatten
from keras.layers.convolutional import Conv2D
from keras.layers.convolutional import MaxPooling2D
from keras.utils import np_utils
from keras import backend as K
K.set_image_dim_ordering('th')
from keras.utils.np_utils import to_categorical
from keras.models import model_from_json

使用“to_categorical”函数将y_train数据转换为分类数据。创建模型的代码如下:

model = Sequential()
model.add(Conv2D(30, (5, 5), input_shape=(1 , 28, 28), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(15, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.2))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(50, activation='relu'))
model.add(Dense(13, activation='softmax'))
# Compile model
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

2.将模型拟合到数据

要使CNN拟合数据,请使用以下代码行。

model.fit(np.array(l), cat, epochs=10, batch_size=200,shuffle=True,verbose=1)

训练我们的模型需要大约三个小时,准确率为98.46%。 经过训练,我们可以将我们的模型保存为json文件以备将来使用,这样我们就不必训练模型并每次等待三个小时。 为了保存我们的模型,我们可以使用以下代码行。

model_json = model.to_json()
with open("model_final.json", "w") as json_file:
 json_file.write(model_json)
# serialize weights to HDF5
model.save_weights("model_final.h5")

测试模型

首先,我们使用以下代码行导入您保存的模型。

json_file = open('model_final.json', 'r')
loaded_model_json = json_file.read()
json_file.close()
loaded_model = model_from_json(loaded_model_json)
# load weights into new model
loaded_model.load_weights("model_final.h5")
  1. 现在,输入包含手写数字的图像。 将图像转换为二进制图像,然后反转图像(如果数字/符号为黑色)。
  2. 现在默认获取图像的轮廓,它将从左到右获得轮廓。
  3. 获取每个轮廓的边界矩形。
  4. 有时,我们可能会获得相同数字/符号的两个或更多轮廓。 为避免这种情况,我们可以检查这两个轮廓的边界矩形是否重叠。 如果它们重叠,则丢弃较小的矩形。
  5. 现在,将所有剩余的边界矩形调整为28乘28。
  6. 使用我们的模型,预测每个边界矩形的相应数字/符号并将其存储在字符串中。
  7. 之后,在字符串上使用’eval’函数来求解方程。

完整代码资源参考:https://github.com/vipul79321/Handwritten-Equation-Solver

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码