机器学习从入门到创业手记-2.1.4 分类决策树与去还是不去

晚上回到了宿舍惯例给家人打电话报报平安,家人希望我能回到天津,他们已经想办法帮我找个稳定,可待遇一般的工作,跟我说这个岗位很多人竞争的,你一定要在一周内赶回来去那个单位报道才行,稳定下来也好买房子啊。我口中一直应付着,放下电话,我也在想我为什么留在北京啊,难道只是因为在天津找不到工作么?

 

       第四天战情室。

 

       早上我推开战情室的大门时,听着高维和路思讨论着问题,原来刘思聪在第二次摇号中,就中签北京的车牌照了,要知道北京两个月才摇一次号,按概率算很多人一辈子也不可能有摇到北京的号牌的,高维:人家不但有钱,运气还好真是比不了啊,我别说买车了,连想也不敢想,还是先解决生存问题吧。路思:你是不是看上人家了?高维:边去吧,人家虽然矮,但眼光高啊。路思:对啊,眼睛长头顶上,能不高么。高维看我进来了,问:安逸你们天津是不是买车也得摇号啊,你家有摇到号么?我:是得摇号,还可以花钱竞拍,但具体怎么回事我不太清楚,我家还没有买车的打算。我脸不知道为什么有点红,有点尴尬,虽然说的都是实话吧。这时杨导师推门进来缓解了我的尴尬。

 

       杨导师:你们还都挺关心别人啊,高维你认为买车很重要么?

 

       高维:是挺重要的,上次我临时要去外地看同学,当时4点的飞机票500元,而5点的火车票要650元,但当时距离4点只有1个小时了,我估计得有30%的可能赶不上车,我当时好纠结的,要是当时刘思聪有车,可以就可以开车送我过去就没这么纠结了。

 

       杨导师:其实这个问题不用那么麻烦,可以通过一个思维模型给你一个最优解。 你主要考虑的是30%赶不上这趟车,如果你四点前到不了飞机场,机票钱要打水漂,还要去改签那个650元的机票。我把这个问题画了个图,大家看2.1。4.1。

 

机器学习从入门到创业手记-2.1.4 分类决策树与去还是不去

图2.1.4.1

机器学习从入门到创业手记-2.1.4 分类决策树与去还是不去

 

       杨导师:我们算一下如果买四点的机票,加入30%赶不上四点航班飞机的风险的总成本是400 * 70% +(400 + 650)* 30% = 599.5这个价格要比直接买五点的650元的机票还是要便宜50元的,从概率角度讲你应该去买四点的机票。 这个思维过程叫做决策树思维,我们很多分类的问题都可以采用决策树来进行推断。而算法中的分类决策树和这个过程有类似的地方,我们将各个分类结果都作为叶节点,而决策过程则是树的分支。我们再来假设一下高维去找同学这件事。大家看我的图2.1.4.2。

 

 

图2.1.4.2

 

杨导师:我假设根据高维的之前经验得出的一个决策树图,每次决策都可以根据这个流程去判断去或不去,这个概念非常的简单,在机器学习中决策树算法的优势是学习和预测速度非常快,如何构造精度高、规模小的决策树是决策树算法的核心内容。决策树构造可以分两步进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般情况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用于数据分析处理的数据集。第二步,决策树的剪枝:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数据集中的数据校验决策树生成过程中产生的初步规则,将那些影响预衡准确性的分枝剪除。

 

       晚上在宿舍里,拿起手机习惯性想给家里报平安,但想到家里肯定会问我回天津的事情考虑的怎么样了,本身我也想回到父母身边,但是回到天津面临很多实际问题,家里的条件很一般,要是再去那个所谓的稳定工作,买房无疑得让家里背负巨额债务,我不忍心啊,毕竟买房应该是我的事情,不应让我父母将我养大,我再把家里掏空,在北京多干几年,这样也能减轻买房的压力。我不由得也根据目前的状况画起了决策树。