首页 / 干货教程 / Python教程 / python机器学习11 对数线性回归(波士顿房价预测)

python机器学习11 对数线性回归(波士顿房价预测)

对数线性回归(波士顿房价预测)

导入模块

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

from matplotlib.font_manager import FontProperties

from sklearn.linear_model import LinearRegression

from sklearn.metrics import r2_score

%matplotlib inline

font = FontProperties(fname='/Library/Fonts/Heiti.ttc')

获取数据

在《代码-普通线性回归》的时候说到特征LSTAT和标记MEDV有最高的相关性，但是它们之间并不是线性关系，尝试多项式回归发现可以得到不错的结果，但是多项式可能会增加模型的复杂度容易导致过拟合的问题出现，是不是可以假设特征和标记之间可能符合对数线性回归呢？即y和x的关系为

ln(y)=x

下面将使用对数线性回归做尝试。

df = pd.read_csv('housing-data.txt', sep='\s+', header=0)

X = df[['LSTAT']].values

y = df['MEDV'].values

# np.log()默认以$e$为底数

y_sqrt = np.log(y)

训练模型

# 增加x轴坐标点

X_fit = np.arange(X.min(), X.max(), 1)[:, np.newaxis]

lr = LinearRegression()

# 线性回归

lr.fit(X, y)

lr_predict = lr.predict(X_fit)

# 计算线性回归的R2值

lr_r2 = r2_score(y, lr.predict(X))

可视化

plt.scatter(X, y, c='gray', edgecolor='white', marker='s', label='训练数据')

plt.plot(X_fit, lr_predict, c='r',

label='线性,$R^2={:.2f}$'.format(lr_r2))

plt.xlabel('地位较低人口的百分比[LSTAT]', fontproperties=font)

plt.ylabel('ln(以1000美元为计价单位的房价[RM])', fontproperties=font)

plt.title('波士顿房价预测', fontproperties=font, fontsize=20)

plt.legend(prop=font)

plt.show()

上图可以看出对数线性回归也能比较不错的拟合特征与标记之间的关系，这次只是使用了标准的对数线性回归拟合两者之间的关系，你也可以自行选择不同的关系函数g(⋅)去拟合两者之间的关系，也许可能会得到一个不错的结果。

上一篇：python机器学习12 正则化线性回归(波士顿房价预测) 下一篇：python机器学习10 多项式回归(波士顿房价预测)

阅读排行

热门推荐

热门标签

机器学习 python培训班 python培训机构学员日记就业喜讯 linux命令 linux基础教程 python基础教程 python爬虫自学数据分析课程自学go语言课程自学linux课程自学python课程上海老男孩教育老男孩IT教育数据分析面试题 go语言面试题 linux运维面试题 python面试题数据分析培训机构 go语言培训机构 linux培训机构 python培训机构数据分析培训数据分析教程学go语言学linux 学python go语言教程 linux教程 python教程 k8s go语言培训 linux培训 linux运维 python培训常见问题干货分享

抢先报名优先占座

快速报名

python机器学习11 对数线性回归(波士顿房价预测)

抢先报名 优先占座

抢先报名优先占座