计算逻辑回归系数的均值边际效应
你喜欢逻辑回归,但又讨厌解释任何带有对数转换的东西吗?嗯,我不能说你有很好的伴侣,但我可以说你有我作为伴侣!
在本文中,我将讨论解释逻辑回归系数的所有内容 – 下面是大纲:
- 解释线性回归系数
- 为什么解释逻辑回归系数很具挑战性
- 如何解释逻辑回归系数
- 使用statsmodels包计算均值边际效应
- 结论
解释线性回归系数
大多数具备统计基础知识的人完全理解如何解释线性回归系数。如果你是其中之一,你可以考虑跳过本文中讨论逻辑回归系数的部分。
解释线性回归系数非常简单和容易。尽管有了更复杂的算法,线性回归之所以仍然是一个非常流行的工具,解释的简单性就是其中一个原因。
简单线性回归(只有一个输入变量的线性回归)的形式如下:
我们主要关心解释 B₁。对于线性回归,这种解释很简单 – 对于x的一个单位变化,我们期望y有一个 B₁ 的变化。这种关系的另一种说法是“均值边际效应”。
让我们通过模拟来看一下如何解释 B₁。模拟是测试数据科学工具/方法的一个很好的工具,因为我们可以制定基准真相,然后看看我们的方法是否能够识别它。
在下面的代码中,我们模拟了30,000行的x值。我们通过从我们选择的参数(在这种情况下是平均值2和标准差0.2的正态分布)中抽样来模拟x值。然后,我们通过将x乘以我们模拟的影响0.16来模拟y,然后我们添加随机误差…