博客
关于我
logistic回归模型python_【机器学习速成宝典】模型篇03逻辑斯谛回归【Logistic回归】(Python版)...
阅读量:792 次
发布时间:2023-02-06

本文共 1964 字,大约阅读时间需要 6 分钟。

一元线性回归、多元线性回归、Logistic回归、广义线性回归、非线性回归的关系

极大似然估计

极大似然估计(Maximum Likelihood Estimate, MLE)是一种参数估计方法。其核心思想是:已知某个随机样本满足某种概率分布,但具体的参数未知。通过观察样本结果,找到能够使得样本出现的概率最大的参数值作为估计。这种方法建立在“已知参数能使事件发生的概率最大,则选择该参数作为真实值”的原则上。

逻辑斯谛回归(Logistic回归)

在机器学习中,线性回归模型最初是用于回归任务的,但当涉及分类问题时,Logistic回归模型提供了一个有效的解决方案。Logistic模型的核心公式为:

[ P(y=1|x) = \frac{1}{1 + e^{-z}} ]

其中,( z = x \beta + \beta_0 ),( \beta ) 为权重参数,( \beta_0 ) 为截距参数。该公式表示,给定输入 ( x ) 的条件下,样本属于正类(( y=1 ))的概率。

Logistic模型的训练目标是最小化对数似然损失函数:

[ L = -\sum_{i=1}^n \left( y_i \cdot \log(\frac{1}{1 + e^{-z_i}}) + (1 - y_i) \cdot \log(1 + e^{-z_i}) \right) ]

通过优化该损失函数,可以得到最优的权重和截距参数。

多类分类Logistic回归

Logistic回归不仅适用于二分类任务,还可以扩展到多类分类问题。常见的扩展方法有两种:

  • One-vs-Rest策略:针对每一类别构建一个单独的Logistic回归模型,并对比预测结果。
  • 多分类Logistic回归:通过扩展Logistic模型直接处理多类任务,通常采用对数似然加和的形式:
  • [ \log L = \sum_{k=1}^K \sum_{i=1}^n [ y_{ik} \cdot \log(\frac{1}{1 + e^{-z_{ik}}}) + (1 - y_{ik}) \cdot \log(1 + e^{-z_{ik}}) ) ] ]

    其中,( y_{ik} ) 表示样本 ( i ) 属于类别 ( k ) 的标记(1表示正类,0表示负类)。

    Python代码(sklearn库)

    以下是使用 scikit-learn 库实现Logistic回归的示例代码:

    from numpy import *from sklearn.datasets import load_irisfrom sklearn.linear_model import LogisticRegression# 加载鸢尾花数据集iris = load_iris()# 拿取训练集和测试集trainX = iris.datatrainY = iris.target# 初始化Logistic回归模型clf = LogisticRegression(    penalty='l2',  # L2正则化    dual=False,     # 不使用对偶形式    tol=1e-4,     # 迭代收敛的容错率    C=1.0,        # 正则化项系数    fit_intercept=True,  # 拟合截距    intercept_scaling=1,  # 截距缩放因子    class_weight=None,  # 类别权重    random_state=None,  # 随机种子    solver='liblinear',  # 使用liblinear求解器    max_iter=100,     # 最大迭代次数    multi_class='ovr',  # 使用one-vs-rest策略    verbose=0         # 不输出日志)# 训练模型clf.fit(trainX, trainY)# 输出权重和截距print("权值:", clf.coef_)print("截距:", clf.intercept_)# 模型性能评估print("分数:", clf.score(trainX, trainY))# 对训练集进行预测print(clf.predict(trainX))print(trainY)

    结论

    通过上述内容可以看出,虽然线性模型简单,却蕴含着丰富的变化形式。例如,通过对Logistic回归模型的扩展,可以得到广义线性回归模型。这种模型不仅适用于二分类任务,还可以扩展到多类分类问题。通过极大似然估计的思想,Logistic回归模型能够有效地解决分类问题,并通过优化对数似然损失函数来找到最佳模型参数。

    转载地址:http://xcufk.baihongyu.com/

    你可能感兴趣的文章
    Lucence简单学习---1
    查看>>
    Lucene.Net 站内搜索
    查看>>
    lucene4.7 正则查询(RegexpQuery)(八)
    查看>>
    lucene: 索引建立完后无法查看索引文件中的数据
    查看>>
    Lucene从入门到精通
    查看>>
    lucene思维导图,让搜索引擎不再难懂
    查看>>
    Lucene(10):Lucene相关度排序
    查看>>
    Lucene(11):搜索案例
    查看>>
    Lucene(1):Lucene介绍
    查看>>
    Lucene(2):Lucene全文检索的流程
    查看>>
    Lucene(4):Field域类型
    查看>>
    Lucene(5):索引维护
    查看>>
    Lucene(6):分词器
    查看>>
    Lucene(7):Lucene高级搜索
    查看>>
    Lucene(8):Lucene底层储存结构
    查看>>
    Lucene(9):Lucene优化
    查看>>
    luckyexcel 编辑预览excel文件
    查看>>
    lumen php命令,浅谈lumen的自定义依赖注入
    查看>>
    lumen开发问题:Call to undefined method Illuminate\Validation\Validator::make()
    查看>>
    lunix或者centos服务器下如何下载自己在github上面的项目代码
    查看>>