草庐IT

Python数据分析案例08——预测泰坦尼克号乘员的生存(机器学习全流程)

 上一篇数据分析案例是回归问题,本次案例带来分类问题的机器学习案例。这个数据集比上个案例更小、更简单,代码也不复杂,新手都可以学一学。1、背景分析预测乘客是否存活下来泰坦尼克号是数据科学机器学习领域很经典的数据集,在统计学里面也有很多案例,比如拟合优度检验,方差分析等等。其背景就是当年泰坦尼克号上那么多人,灾难发生后,有人生存有人死亡,而且每个人都有很多不同的特征,比如性别,年龄,船仓等级,登船地点等等.....根据这些特征,我们可以预测乘客是否存活下来。存活是1,死亡是0,响应变量为两种取值,所以这是一个分类问题。2、数据收集和读取从kaggle上下载泰坦尼克号的数据¶kaggle是国际很有