# 1.读取数据
import numpy as np;
X = np.loadtxt('D:\\stock_customers.txt', delimiter = '\t'); #注意:如果文件存放路径不同,则需要修改路径。
# 2.划分输入特征和输出特征
y = X[:,0]; #首列就是分类标记
X = X[:,1:6]; #相当于取1,2,3,4,5列,如果更换数据集,需要提根据列数重新设置。
# 3.划分训练集和测试集
from sklearn.model_selection import train_test_split;
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1);
# 4.模型搭建
from sklearn.linear_model import LogisticRegression;
model = LogisticRegression();
model.fit(X_train, y_train);
# 5.模型使用1 - 预测数据结果
y_pred = model.predict(X_test);
print('前100个预测结果展示:', y_pred[0:100]);
from sklearn.metrics import accuracy_score;
score = accuracy_score(y_pred, y_test);
print('准确率=', score);
model.score(X_test, y_test);
# 6.模型使用2 - 预测概率
y_pred_proba = model.predict_proba(X_test) ;
print('输出前5名的概率展示\n', y_pred_proba[0:5]);
#print(y_pred_proba[:,1]);
# 7.查看各个变量的系数
print('模型系数:\n', model.coef_);
print('模型截距:', model.intercept_); |