NumPy 随机数
NumPy 的随机数功能非常强大,主要由 numpy.random模块完成。
首先,我们需要了解如何使用 NumPy 也就是生成一些满足基本需求的随机数据。主要由以下一些方法完成:
numpy.random.rand(d0, d1, ..., dn) 方法的作用为:指定一个数组,并使用 [0, 1) 区间随机数据填充,这些数据均匀分布。
np.random.rand(2, 5)
numpy.random.randn(d0, d1, ..., dn) 与 numpy.random.rand(d0, d1, ..., dn) 的区别在于,前者是从标准正态分布中返回一个或多个样本值。
np.random.randn(1, 10)
randint(low, high, size, dtype) 方法将会生成 [low, high) 的随机整数。注意这是一个半开半闭区间。
np.random.randint(2, 5, 10)
random_sample(size) 方法将会在 [0, 1) 区间内生成指定 size 的随机浮点数。
np.random.random_sample([10])
与 numpy.random.random_sample 类似的方法还有:
- numpy.random.random([size])
- numpy.random.ranf([size])
- numpy.random.sample([size])
它们 4 个的效果都差不多。
choice(a, size, replace, p) 方法将会给定的数组里随机抽取几个值,该方法类似于随机抽样。
np.random.choice(10, 5)
上面的代码将会在 np.arange(10) 中随机抽取 5 个数。
概率密度分布
除了上面介绍的 6 种随机数生成方法,NumPy 还提供了大量的满足特定概率密度分布的样本生成方法。它们的使用方法和上面非常相似,这里就不再一一介绍了。列举如下:
- numpy.random.beta(a,b,size):从 Beta 分布中生成随机数。
- numpy.random.binomial(n, p, size):从二项分布中生成随机数。
- numpy.random.chisquare(df,size):从卡方分布中生成随机数。
- numpy.random.dirichlet(alpha,size):从 Dirichlet 分布中生成随机数。
- numpy.random.exponential(scale,size):从指数分布中生成随机数。
- numpy.random.f(dfnum,dfden,size):从 F 分布中生成随机数。
- numpy.random.gamma(shape,scale,size):从 Gamma 分布中生成随机数。
- numpy.random.geometric(p,size):从几何分布中生成随机数。
- numpy.random.gumbel(loc,scale,size):从 Gumbel 分布中生成随机数。
- numpy.random.hypergeometric(ngood, nbad, nsample, size):从超几何分布中生成随机数。
- numpy.random.laplace(loc,scale,size):从拉普拉斯双指数分布中生成随机数。
- numpy.random.logistic(loc,scale,size):从逻辑分布中生成随机数。
- numpy.random.lognormal(mean,sigma,size):从对数正态分布中生成随机数。
- numpy.random.logseries(p,size):从对数系列分布中生成随机数。
- numpy.random.multinomial(n,pvals,size):从多项分布中生成随机数。
- numpy.random.multivariate_normal(mean, cov, size):从多变量正态分布绘制随机样本。
- numpy.random.negative_binomial(n, p, size):从负二项分布中生成随机数。
- numpy.random.noncentral_chisquare(df,nonc,size):从非中心卡方分布中生成随机数。
- numpy.random.noncentral_f(dfnum, dfden, nonc, size):从非中心 F 分布中抽取样本。
- numpy.random.normal(loc,scale,size):从正态分布绘制随机样本。
- numpy.random.pareto(a,size):从具有指定形状的 Pareto II 或 Lomax 分布中生成随机数。
- numpy.random.poisson(lam,size):从泊松分布中生成随机数。
- numpy.random.power(a,size):从具有正指数 a-1 的功率分布中在 0,1 中生成随机数。
- numpy.random.rayleigh(scale,size):从瑞利分布中生成随机数。
- numpy.random.standard_cauchy(size):从标准 Cauchy 分布中生成随机数。
- numpy.random.standard_exponential(size):从标准指数分布中生成随机数。
- numpy.random.standard_gamma(shape,size):从标准 Gamma 分布中生成随机数。
- numpy.random.standard_normal(size):从标准正态分布中生成随机数。
- numpy.random.standard_t(df,size):从具有 df 自由度的标准学生 t 分布中生成随机数。
- numpy.random.triangular(left,mode,right,size):从三角分布中生成随机数。
- numpy.random.uniform(low,high,size):从均匀分布中生成随机数。
- numpy.random.vonmises(mu,kappa,size):从 von Mises 分布中生成随机数。
- numpy.random.wald(mean,scale,size):从 Wald 或反高斯分布中生成随机数。
- numpy.random.weibull(a,size):从威布尔分布中生成随机数。
- numpy.random.zipf(a,size):从 Zipf 分布中生成随机数。
数学函数
使用 Python 自带的运算符,你可以完成数学中的加减乘除,以及取余、取整,幂次计算等。导入自带的 math 模块之后,里面又包含绝对值、阶乘、开平方等一些常用的数学函数。不过,这些函数仍然相对基础。如果要完成更加复杂一些的数学计算,就会显得捉襟见肘了。
NumPy 为我们提供了更多的数学函数,以帮助我们更好地完成一些数值计算。下面就依次来看一看。
三角函数
首先, 看一看 NumPy 提供的三角函数功能。这些方法有:
- numpy.sin(x):三角正弦。
- numpy.cos(x):三角余弦。
- numpy.tan(x):三角正切。
- numpy.arcsin(x):三角反正弦。
- numpy.arccos(x):三角反余弦。
- numpy.arctan(x):三角反正切。
- numpy.hypot(x1,x2):直角三角形求斜边。
- numpy.degrees(x):弧度转换为度。
- numpy.radians(x):度转换为弧度。
- numpy.deg2rad(x):度转换为弧度。
- numpy.rad2deg(x):弧度转换为度。
比如,我们可以用上面提到的 numpy.rad2deg(x) 将弧度转换为度。
np.rad2deg(np.pi) # PI 值弧度表示
上面的这些函数非常简单,就不再一一举例了。你可以自己新建一些空白单元格练习。
双曲函数
在数学中,双曲函数是一类与常见的三角函数类似的函数。双曲函数经常出现于某些重要的线性微分方程的解中,使用 NumPy 计算它们的方法为:
- numpy.sinh(x):双曲正弦。
- numpy.cosh(x):双曲余弦。
- numpy.tanh(x):双曲正切。
- numpy.arcsinh(x):反双曲正弦。
- numpy.arccosh(x):反双曲余弦。
- numpy.arctanh(x):反双曲正切。
数值修约
数值修约, 又称数字修约, 是指在进行具体的数字运算前, 按照一定的规则确定一致的位数, 然后舍去某些数字后面多余的尾数的过程。比如, 我们常听到的「4 舍 5 入」就属于数值修约中的一种。
- numpy.around(a):平均到给定的小数位数。
- numpy.round_(a):将数组舍入到给定的小数位数。
- numpy.rint(x):修约到最接近的整数。
- numpy.fix(x, y):向 0 舍入到最接近的整数。
- numpy.floor(x):返回输入的底部(标量 x 的底部是最大的整数 i)。
- numpy.ceil(x):返回输入的上限(标量 x 的底部是最小的整数 i).
- numpy.trunc(x):返回输入的截断值。
求和、求积、差分
下面这些方法用于数组内元素或数组间进行求和、求积以及进行差分。
- numpy.prod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积。
- numpy.sum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和。
- numpy.nanprod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积, 将 NaN 视作 1。
- numpy.nansum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和, 将 NaN 视作 0。
- numpy.cumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积。
- numpy.cumsum(a, axis, dtype):返回沿给定轴的元素的累积总和。
- numpy.nancumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积, 将 NaN 视作 1。
- numpy.nancumsum(a, axis, dtype):返回沿给定轴的元素的累积总和, 将 NaN 视作 0。
- numpy.diff(a, n, axis):计算沿指定轴的第 n 个离散差分。
- numpy.ediff1d(ary, to_end, to_begin):数组的连续元素之间的差异。
- numpy.gradient(f):返回 N 维数组的梯度。
- numpy.cross(a, b, axisa, axisb, axisc, axis):返回两个(数组)向量的叉积。
- numpy.trapz(y, x, dx, axis):使用复合梯形规则沿给定轴积分。
指数和对数
如果你需要进行指数或者对数求解,可以用到以下这些方法。
- numpy.exp(x):计算输入数组中所有元素的指数。
- numpy.log(x):计算自然对数。
- numpy.log10(x):计算常用对数。
- numpy.log2(x):计算二进制对数。
算术运算
当然,NumPy 也提供了一些用于算术运算的方法,使用起来会比 Python 提供的运算符灵活一些,主要是可以直接针对数组。
- numpy.add(x1, x2):对应元素相加。
- numpy.reciprocal(x):求倒数 1/x。
- numpy.negative(x):求对应负数。
- numpy.multiply(x1, x2):求解乘法。
- numpy.divide(x1, x2):相除 x1/x2。
- numpy.power(x1, x2):类似于 x1^x2。
- numpy.subtract(x1, x2):减法。
- numpy.fmod(x1, x2):返回除法的元素余项。
- numpy.mod(x1, x2):返回余项。
- numpy.modf(x1):返回数组的小数和整数部分。
- numpy.remainder(x1, x2):返回除法余数
矩阵和向量积
求解向量、矩阵、张量的点积等同样是 NumPy 非常强大的地方。
- numpy.dot(a, b):求解两个数组的点积。
- numpy.vdot(a, b):求解两个向量的点积。
- numpy.inner(a, b):求解两个数组的内积。
- numpy.outer(a, b):求解两个向量的外积。
- numpy.matmul(a, b):求解两个数组的矩阵乘积。
- numpy.tensordot(a, b):求解张量点积。
- numpy.kron(a, b):计算 Kronecker 乘积。
除了上面这些归好类别的方法,NumPy 中还有一些用于数学运算的方法,归纳如下:
- numpy.angle(z, deg):返回复参数的角度。
- numpy.real(val):返回数组元素的实部。
- numpy.imag(val):返回数组元素的虚部。
- numpy.conj(x):按元素方式返回共轭复数。
- numpy.convolve(a, v, mode):返回线性卷积。
- numpy.sqrt(x):平方根。
- numpy.cbrt(x):立方根。
- numpy.square(x):平方。
- numpy.absolute(x):绝对值, 可求解复数。
- numpy.fabs(x):绝对值。
- numpy.sign(x):符号函数。
- numpy.maximum(x1, x2):最大值。
- numpy.minimum(x1, x2):最小值。
- numpy.nan_to_num(x):用 0 替换 NaN。
- numpy.interp(x, xp, fp, left, right, period):线性插值。
代数运算
上面,我们分为 8 个类别,介绍了 NumPy 中常用到的数学函数。这些方法让复杂的计算过程表达更为简单。除此之外,NumPy 中还包含一些代数运算的方法,尤其是涉及到矩阵的计算方法,求解特征值、特征向量、逆矩阵等,非常方便。
- numpy.linalg.cholesky(a):Cholesky 分解。
- numpy.linalg.qr(a ,mode):计算矩阵的 QR 因式分解。
- numpy.linalg.svd(a ,full_matrices,compute_uv):奇异值分解。
- numpy.linalg.eig(a):计算正方形数组的特征值和右特征向量。
- numpy.linalg.eigh(a, UPLO):返回 Hermitian 或对称矩阵的特征值和特征向量。
- numpy.linalg.eigvals(a):计算矩阵的特征值。
- numpy.linalg.eigvalsh(a, UPLO):计算 Hermitian 或真实对称矩阵的特征值。
- numpy.linalg.norm(x ,ord,axis,keepdims):计算矩阵或向量范数。
- numpy.linalg.cond(x ,p):计算矩阵的条件数。
- numpy.linalg.det(a):计算数组的行列式。
- numpy.linalg.matrix_rank(M ,tol):使用奇异值分解方法返回秩。
- numpy.linalg.slogdet(a):计算数组的行列式的符号和自然对数。
- numpy.trace(a ,offset,axis1,axis2,dtype,out):沿数组的对角线返回总和。
- numpy.linalg.solve(a, b):求解线性矩阵方程或线性标量方程组。
- numpy.linalg.tensorsolve(a, b ,axes):为 x 解出张量方程 a x = b
- numpy.linalg.lstsq(a, b ,rcond):将最小二乘解返回到线性矩阵方程。
- numpy.linalg.inv(a):计算逆矩阵。
- numpy.linalg.pinv(a ,rcond):计算矩阵的(Moore-Penrose)伪逆。
- numpy.linalg.tensorinv(a ,ind):计算 N 维数组的逆。