百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

python编程之神经网络篇

toyiye 2024-06-27 01:07 36 浏览 0 评论

#头条创作挑战赛#神经网络发展到今天大致经历了2次兴起和2次衰落,1943年心理学家McCulloch(麦卡洛克)和数学家Pitts(皮茨)参考生物神经系统的工作原理,首次提出建立了MP神经元模型。

其中x1、x2、x3……xn来表示输入,w1、w2……wn表示权重,代表每个信号的重要程度,计算公式为:x1*w1+x2*w2+x3*w3+……+xn*wn,这被称为信号的加权求和,中间的f代表激活函数,它会对计算结果进行处理,只有大于阈值θ的才会被输出,否则不输出(或者输出为0)。神经元的整个计算公式如下

MP模型采用的激活函数是阶跃函数sgn(x)

1958年罗森布拉特基于MP模型提出感知机模型,最早的感知机就是由输入和输出层组成的线性分类器,输入层把信号加权求和传递给输出层,权重初始值是随机给定的,然后计算损失值就是输出结果和标签值之差,再根据损失值反向调整输入权重,重复多次直至模型可以很好拟合数据,实现有效分类,过程如图所示。

当时罗森布拉特演示使用该算法识别出简单图像,引发了全社会关注,美国军方甚至认为神经网络比“原子弹”更重要,大力投入经费研发使得神经网络的发展进入第一次高潮。但随着1969年人工智能泰斗马文·明斯基发文指出单层感知机无法完成异或问题,而多层感知机对计算机算力要求又太高,从而认为深度神经网络的研究没有意义,致使神经网络进入了第一次冰河期。异或问题如下所示,这种问题需要采用非线性方式解决,右图使用椭圆实现分类。

1970年芬兰数学家Seppo Linnainmaa提出反向传播算法,但当时没有引起人们足够的重视,1983年物理学家John Hopfield利用神经网络,在求解旅行商问题上获得了当时最好成绩,引起了轰动。但是20世纪90年代支持向量机的诞生又一次让神经网络陷入低谷,因为支持向量机可以把二维数据映射到高维从而简单完成非线性分类,并且没有增加计算复杂度,而且还支持小样本数据的回归和分类,相比较而言神经网络的可解释性较差,经常被称为黑盒子(人们很难说清楚每一个隐藏层的功能,所以使用的时候很担心)并且需要非常大量的数据,需要高性能的计算机。神经网络工作过程如下图所示。

Image Net是世界级计算机视觉领域挑战赛,比赛任务之一是对1000类图片分类。2010年冠军队使用支持向量机和手工操作相结合,错误率为28.2%,2012年多伦多大学首先使用深度神经网络使错误率降至15.3%,使用的神经网络仅由五个卷积层和三个全连接层组成,再一次把神经网络的研究推向高潮。之后每年的比赛都是神经网络的较量赛,2016年冠军团队使用了500多个卷积层,至此之后人们开始使用更多的隐藏层和神经元来解决问题。如今,据说微软使用了152层神经网络,拥有数千万级的神经元。

2011年IBM的超级计算机“沃森”打败人类选手夺得100万美元奖金。2016年谷歌的AlphaGo接连打败世界围棋冠军李世石和柯洁,它就是使用了神经网络算法。现在神经网络算法的使用已经非常广泛了,但人们依旧不知道黑盒子中的秘密,谷歌曾有一位工程师导出了AlphaGo的运行数据,想要研究一下它下围棋的秘诀,从而传授给学围棋的儿子,但研究了很久他也无法看懂隐藏层的调参过程。

下面就以建立单神经元模型求解直线方程为例来讲解。

根据我们的经验可以得到该方程应该是线性的:y=w*x+b,w为斜率,b为偏置项。

#导入要使用的第三方库
import tensorflow as tf                      #导入tensorflow库
import numpy as np                         #导入numpy库
import matplotlib.pyplot as plt        #导入绘图库

#生成数据
X=np.linspace(-1,1,100)        #使用numpy的linspace函数生成等差数列,-1到1之间的100个数    
y=2*X+1+np.random.randn(*X.shape)*0.4  #生成每个X对应的y值,y=2*x+1
#np.random.randn是生成一组服从标准正态分布的随机样本值,这里是加入噪音
plt.scatter(X,y)                      #绘制生成的数据散点图

def model(x,w,b):                   #建立模型,计算x*w+b,返回计算结果
    return tf.multiply(x,w)+b   #tf.multiply函数是把x和w对应位置的元素相乘

def loss(x,y,w,b):                            #定义损失函数,求均方差
    error=model(x,w,b)-y                #计算模型预测值和真实值的差
    squard=tf.square(error)            #求差值的平方,tf.square函数是对每一个参数求平方
    return tf.reduce_mean(squard)  #tf.reduce_mean计算参数某一维度的平均值,这里没有写维度

def grad(x,y,w,b):                              #定义梯度函数,计算x,y在w,b上的梯度
    with tf.GradientTape() as tape:     #tf.GradientTape封装了求导的计算
        loss_=loss(x,y,w,b)                    #调用损失函数计算均方差
    return tape.gradient(loss_,[w,b])  #对均方差在[w,b]上求导,返回梯度向量

w=tf.Variable(np.random.randn(),tf.float32)  #tf.Variable是声明变量,可以保存和更新参数
#构建变量w表示线性函数的斜率,初始值为随机生成的服从正态分布的数值
b=tf.Variable(0.0,tf.float32)                            #构建变量b表示线性函数的截距,初始值为0
p=8                                                                #训练的轮数,迭代次数
learn_rate=0.01                                             #学习率

for e in range(p):                                          #重复训练p次             
    for xx,yy in zip(X,y):                                  #每次从X和y中逐一取出[xx,yy]数据
        w_,b_=grad(xx,yy,w,b)                          #计算当前数据[xx,yy]在[w,b]上的梯度向量
        c_w=w_*learn_rate                               #梯度向量w*学习率=需要调整的w
        c_b=b_*learn_rate                                #梯度向量b*学习率=需要调整的b
        w.assign_sub(c_w)                                #w减去需要调整的w得到新的w
        b.assign_sub(c_b)                                 #b减去需要调整的b得到新的b
    plt.plot(X,w.numpy()*X+b.numpy())        #每一轮结束绘制一条拟合数据的直线
plt.show() 

8轮迭代训练之后,模型基本稳定,画出的直线方程差异越来越小,最大化拟合了现有数据。

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码