python做excel自动化-用python进行办公自动化都需要学习什么知识呢?
自动化办公无非是excel、ppt、word、邮件、文件处理、数据分析处理、爬虫这些。我来一一介绍如何学习,找资料!
最近做了个Python办公自动化的Live讲座,不要脸的推一波~
python基础
能做这些的前提是会使用Python,最起码要熟悉基本语法,可以编写小脚本。
对于python语法的要求,你可以对照Python基础 的部分查看需要学那些,找个免费****跟着学,然后多敲代码练习。如果喜欢看书的话,可以买本python入门书备查。
语法是关键,一定要理解python编程的基本概念,再去学其他的工具库。
不然会很痛苦的。
excel自动化
office家族其实都可以用VBA解决自动化的问题,但可能很多人不会用。
python针对excel有很多的第三方库可以用,比如xlwings、xlsxwriter、xlrd、xlwt、pandas、xlsxwriter、win32com、xlutils等等。
这些库可以很方便地实现对excel文件的增删改写、格式修改等,当然并不推荐你全部都去尝试一下,这样时间成本太大了。使用xlwings和pandas这两个就够了,基本能解决excel自动化的所有问题。
xlwing不光可以读写excel,还能进行格式调整、VBA操作,非常强大且易于使用。
之前写过一个xlwings的入门教程:朱卫军:xlwings,让excel飞起来!zhuanlan.zhihu.com
你也可以查询具体用法(中文总结):
当然最好是看官网教程: />xlwings处理excel
pandas是大家都熟悉的数据处理利器,它也支持excel的读写,接口友好。这个后面会讲到。
如果你对python自动化处理excel很有兴趣,也可以买一本专门的教材来看。
ppt
python当然是支持ppt的自动化处理,主要的库有pywin32com、pptx,可以创建、修改ppt文件。
学习网站: />
word
python操作Word的库:python-docx、import docx:只对windows平台有效
pypiwin32、import win32com:跨平台,但无法处理doc格式的word文本,doc格式不是基于xml的
textract、import textract:它同时兼顾"doc”和"docx”,但安装过程需要一些依赖。
你可以批量的用python生成word文件,推荐使用docx,不需要会太多。
学习网站:
邮件
python处理邮件也是极其便利的,smtplib、imaplib、email三个库配合使用,实现邮件编写、发送、接收、读取等一系列自动化操作,省时省力。
写过一个发送邮件教程,亲测可用:朱卫军:干货 | 解放双手,用Python实现自动发送邮件zhuanlan.zhihu.com
看了其他很多教程都有问题,所以这个大家可以跑跑上面的代码。
文件处理
文件处理包括批量修改或创建文件名、批量生成文档、批量修改路径等等重复性操作。如果一个个手工操作,那真的心累。
python在处理批量操作有得天独厚的优势,成千上万的文件修改可能只需几秒的时间。
os是python文件操作的库,可以实现对电脑上文件的增删改查。
学习网站: />
数据处理和分析
我就是做数据分析工作的,基本也是python作为主要工具,所以这一块毋庸置疑是python自动化办公最有价值的部分。
数据处理的库主要有:pandas、numpy、matplotlib、sklearn...
这些是大家耳熟能详的神库,非常推荐去学习。
之前写过很多关于python数据分析处理的回答和文章,这里不再啰嗦了。超级菜鸟怎么学习数据分析?www.zhihu.com如何系统地学习Python 中 matplotlib, numpy, scipy, pandas?www.zhihu.com
推荐两本python数据分析的入门书,也是我一开始用的:
爬虫
相信爬虫是大家最感兴趣的,python爬虫有很多的实现库,比如:urllib、requests、scrapy等
爬虫入门容易,但学精难,所以初学者可以尝试写点简单的爬虫,比如豆瓣、知乎、微博呀。
这个也不多说,直接上之前的干货:如何入门 Python 爬虫?www.zhihu.com朱卫军:干货!python爬虫100个入门项目 续zhuanlan.zhihu.com
推荐大家去学习requests、bs4来入门爬虫,提供对应中文学习网站:
也可以买两本教程书作为补充:
最后给一个福利:朱卫军:最全数据分析资料汇总(含python、爬虫、数据库、大数据、tableau、统计学等)zhuanlan.zhihu.com