大数据之:影像提取中深度学习样本获取的思考

话说,虾神一直是做空间统计和数据分析的,对于深度学习这个热门学科,一直以来也就停留在“了解”阶段,虽然这个平展开来,里面比较核心的技术使用了聚类,而虾神研究生的时候做的课题也正好是空间聚类,所以也算有点沾亲带故把。但是毕竟不是专门做这个的,具体的技术细节也处于一知半解的状态,而今天突然“赶时髦”般的想写这样一篇文章,无论是蹭热点也好,东施效颦也好,因为有些事情已经到了不吐不快的程度。

机器学习的基本原理。就像下面的漫画:你告诉一台电脑,1+1 =2 然后,问它,它回答等于500,你一边丢他老木,一边不停的矫正,告诉它等于2,等于2,经过无数次的矫正,最后电脑终于知道1+1 =2,那么第一阶段目标达成。。。然后你就可以开始教它1+2 =3 了。

大数据之:影像提取中深度学习样本获取的思考

不管是啥学习,关键在于学习两个字,从人类获取知识的角度来说,最标准的流程就是:教——学。首先要有老师教,也就是所谓的启蒙,之后再进去引导,最后才是完全的自学。哪怕是在自学中,如果有人正确的提点,那么效果也会比自学好很多倍。告诉的过程就是所谓的“训练”,比如识别苹果,人们先准备几百张(几千?几万?几十万?)张不同角度,不同颜色、不同表现的苹果的图片,然后用相应的模式提取出表达为苹果的特征,然后这些特征转换成机器能够读懂的数据模型,比如rgb为255,0,0的就是红色,大部分苹果的颜色都是红色——诸如此类的。提取特征,用新提取的特征,去原来训练好的模型里面去验证一下,如果符合某些设定,那么机器就会告诉你,这个图片里面有没有苹果。批改家庭作业和测试一样,然后把新的图片再加入到样本集中,修正模型但是在我们做人工解译的过程中以及之后,没有留下任何可以复用的成果如果说进行人工解译的时候,把所有的特征数据通过提取——标记的方式,制作成样本库,将这些样本库作为机器学习的样本来提供给程序进行训练。这种方法会被人直接跳出来准备用砖头呼在虾神脸上:你说得轻松,矢量化本来就很辛苦了,还给你去做提取标记,这是N倍的工作量好吧!你来开工资么?就算你你开得出工资,项目时间呢?我们争分夺秒的干活,你还在这里不切实际的在幻想……最后总结出一句话:不懂的走开,瞎指挥……当绘制出矢量信息之后,把矢量线(或者面)写入属性信息,那么需要做仅仅是利用这些矢量的面(或者线)直接对栅格数据进行一个按掩膜提取就可以了。大数据之:影像提取中深度学习样本获取的思考大数据之:影像提取中深度学习样本获取的思考按掩膜提取即可:大数据之:影像提取中深度学习样本获取的思考大数据之:影像提取中深度学习样本获取的思考大数据之:影像提取中深度学习样本获取的思考大数据之:影像提取中深度学习样本获取的思考1、遥感影像要进行机器学习获取样本,很容易的可以从矢量化结果中来。2、矢量化将不再是结果,而只是一个中间的过程。

3、GIS的传统工具,在大数据中,依然会变得很有用,正如英国人发明了坦克,而德国人仅仅在使用的手法上做出了一些改变,就改变了整个战争的形态。

4、当我们做的工作越来多,那么我们的样本库就会越来越丰富,那么机器就会越来越聪明……千里之行始于足下,就从基础数据提取开始吧。