线性回归(Linear Regression)是一种用于建立连续数值预测模型的方法。它基于线性关系的假设,通过找到自变量(输入特征)和因变量(输出目标)之间的线性关系,进行预测和建模。线性回归的目标是找到最佳拟合直线,以最小化预测值和真实值之间的平方差距离。这种最小化误差的方法被称为最小二乘法。线性回归适用于输入特征和输出目标之间具有线性关系的问题,例如预测房屋价格、销售量等连续数值型的输出。
当谈到线性回归的图形表示时,通常使用散点图和最佳拟合直线来展示数据的分布和线性关系。以下是一个简单的线性回归图示例:
import numpy as np
import matplotlib.pyplot as plt
# 生成随机数据
np.random.seed(0)
X = np.random.rand(100, 1) * 10
y = 2 * X + np.random.randn(100, 1)
# 绘制散点图
plt.scatter(X, y, color='blue', label='Data Points')
# 计算最佳拟合直线
X_line = np.linspace(0, 10, 100)
y_line = 2 * X_line
plt.plot(X_line, y_line, color='red', label='Best Fit Line')
# 添加图例和标签
plt.legend()
plt.xlabel('X')
plt.ylabel('y')
plt.title('Linear Regression')
# 显示图形
plt.show()
逻辑回归(Logistic Regression)是一种用于建立分类模型的方法。与线性回归不同,逻辑回归的输出是离散的,并用于预测二元分类或多元分类问题。逻辑回归通过应用逻辑函数(如Sigmoid函数)将线性组合的输入特征转换为概率值。这个概率值可以被解释为属于某个类别的可能性。逻辑回归通过最大似然估计或梯度下降等方法来学习最佳的参数权重,以使预测的概率与实际标签尽可能一致。逻辑回归适用于二分类问题(如判断邮件是否为垃圾邮件)或多分类问题(如图像分类)。
线性回归和逻辑回归在许多方面都有相似之处,包括参数估计和模型评估的方法。它们都可以受到异常值和特征缩放的影响,并且都可以使用正则化技术(如L1和L2正则化)来防止过拟合。然而,它们在目标函数和输出的不同方面有所区别,因为线性回归使用连续数值输出,而逻辑回归使用离散的概率输出。
当谈到逻辑回归的图形表示时,通常使用散点图和决策边界来展示数据的分类情况。以下是一个简单的逻辑回归图示例:
import numpy as np
import matplotlib.pyplot as plt
# 生成两个类别的随机数据
np.random.seed(0)
X1 = np.random.randn(50, 2) + np.array([2, 2])
X2 = np.random.randn(50, 2) + np.array([-2, -2])
X = np.vstack((X1, X2))
y = np.hstack((np.zeros(50), np.ones(50)))
# 绘制散点图
plt.scatter(X[:, 0], X[:, 1], c=y, cmap='bwr', label='Data Points')
# 定义逻辑函数
def sigmoid(x):
return 1 / (1 + np.exp(-x))
# 计算决策边界
x1_min, x1_max = X[:, 0].min() - 1, X[:, 0].max() + 1
x2_min, x2_max = X[:, 1].min() - 1, X[:, 1].max() + 1
xx1, xx2 = np.meshgrid(np.linspace(x1_min, x1_max, 100),
np.linspace(x2_min, x2_max, 100))
X_grid = np.c_[xx1.ravel(), xx2.ravel()]
Z = sigmoid(X_grid.dot([1, 1]))
# 绘制决策边界
Z = Z.reshape(xx1.shape)
plt.contour(xx1, xx2, Z, levels=[0.5], colors='black')
# 添加图例和标签
plt.legend()
plt.xlabel('X1')
plt.ylabel('X2')
plt.title('Logistic Regression')
# 显示图形
plt.show()
总结下,线性回归用于连续数值预测问题,逻辑回归用于分类问题。线性回归基于线性关系,逻辑回归应用逻辑函数来进行分类概率的转换。这两种算法在实践中都非常常见,并且为许多机器学习问题提供了强大的工具。