大数据

Hi, 请登录

如何利用python实现办公自动化-数据处理

网站SEO诊断与整站SEO优化模板,拿去就可以用>>    SEO干货网站内部链接优化与整站优化>>   

2021年5月12日更新,增加了VS code的功能介绍

2021年7月10日更新,增加了PyQt界面设计的内容

看到大家对于办公自动化的回答比较感兴趣,因此写了这个3000的字长文~~,跟大家聊聊如何使用python实现办公自动化。如果你觉得对你有帮助,欢迎点赞收藏!~~如果能关注我 @风翼之痕就更好了,另外,如果你有任何的困惑,欢迎在评论区讨论。本文主要从以下几个方面介绍:

什么是办公自动化办公自动化包含的内容如何实现办公自动化什么是办公自动化

顾名思义就是实现自动办公。主要包含两个方面,办公和自动化。

办公主要是针对,工作中处理一些excel表格,尤其是重复性特别高的工作内容,这些工作往往还不能体现价值,反而占用大量的时间,但是又不得不定期给领导汇报数据结果。毕竟有些数据要定期看。

自动化就是使用python将业务逻辑提前写在程序中,让你在处理这些工作时能够事半功倍。程序写完之后,每次只需要点击就可以了,结算完成后也无需再为计算过程中可能存在的失误而担心,提高工作效率,让你有更多的时间做更有价值的事情。(个人主要用来处理excel和爬数据,对于处理邮件和做PPT没有涉猎)

办公自动化包含的内容

办公自动化主要包括:处理excel,爬虫,处理邮箱,处理PPT和处理Word文档,处理PDF等等;我在工作中接触最多的还是处理excel,在就是会用到爬虫,因为有些数据在网站上。

其他我都没接触过,因为boss对PPT的质量要求很高,邮箱又非常正式,而且Outlook自带的规则也能对邮件进行分类整理,PDF和Word本人工作中也不常用。

如何实现办公自动化1.基础学习

python的基础学习非常重要,基础扎实了,才能想别的方向发展,个人推荐通过在B站看视频的方式进行学习(本人推荐小甲鱼),讲的细致,风趣幽默,还可以在弹幕和评论区与志同道合的小伙伴交流。关于推荐B站的理由,我在这个回答中详细进行了解答。

小甲鱼的视频见下面的地址:

另外如果有喜欢看书的同学,或者说想看书再把知识掌握的更牢固些,我推荐看这两本书。第一本偏基础,对于基础内容的讲解非常细致,非常推荐看一下,第二本与第一本有重复内容,主要是有点例子,选看部分内容即可。

当然,如果你更喜欢有人能指导你,还有人可以交流的话,也可以选择知乎推荐的课程,通过面对面、实时的交流学习,一定会让你的学习更加愉快,更加有获得感。

如果你是新手,那么,你一定要看下我这篇文章,VS code绝对是能让你事半功倍的利器。各种个性化的内容,让你的VS code与众不同。

2.数据处理

基础学完之后,对于普通的语法有了比较好的掌握,可以进行一些包的学习了。在处理excel方面有许多包,像xlrd,xlwt,openpyxl,xlwings和pandas等等。

xlrd:只能读取数据需要配合xlwt进行写入,而且这两个包已经不怎么更新了,个人不是很长用,也不推荐xlwings:据说可以操作VBA,VBA可太难了,学了几天就放弃了。openpyxl:这个模块个人比较常用,尤其是处理简单的表格,跟xlwings的函数略有不同,看看官方文档就能用了。pandas:这个模块非常强大,自带的函数非常多,而且使用自带函数运算速度很快。它依靠的是pandas自带的DataFrame数据存储格式。

总结而言,个人觉得可以看看openpyxl或者xlwingexcel数据分析自动化,然后再接触下pandas,一步步进阶。

如何学习这些包,可以采用以下途径找资料进行学习。

最后也推荐本书:

这本书是介绍numpy和pandas的,细致的讲解了数据结构,和pandas中常用的一些函数,聚合、透视等等,另外对于matplotlib和seaborn也有讲解。

3.图表制作

在对数据进行处理之后,可能还会需要生成固定格式的报表,那么这时候python的绘图库也就有了用武之地,这里主要介绍两个模块;

1.matplotlib:一个传统而且功能强大的库,缺点也就是你需要自己手动调整所有参数,比较费时费力。那么如何学习呢,基本复制官方的例子,再配合百度点绘图中的小问题就能快速的入门,当然上面关于pandas的书中也有介绍:

2.seaborn:接触这个库之后,就感觉绘图轻松多了,因为它在matplotlib的基础上进行了更高级的API封装,使得作图更加简单。

3.pyecharts:这个是百度开源的库,生成的可视化图表非常好看,而且对于绘制中国地图有需求的同学这个库将是不二之选。大家可以看官网教程学习,地址如下,注意这个模块有 v0.5.X 和 v1 两个大版本,v0.5.X 和 v1 间不兼容,v1 是一个全新的版本。绘图的方式完全不同,百度到的资料多数是V0.5.X,你要是默认pip安装的话,会默认安装v1,导致你使用过程中报错。

4.爬取数据

相信大家都听说过爬虫,目前我主要是自己爬数据玩,或者是工作中有些网页需要不断爬取数据,方便统计数据,如果有一定的web基础会更好,学起来更加快。

推荐大家看这本书,这本书对selenium模块这个模块也有介绍,另外推荐大家看这个视频,up主做了详细的介绍。可以跟着做一遍,这样基本就能实践了。

上面的爬虫视频稍微差点,个人觉得实用性不如下面这个,这两天整理资料的时候才发现的,抱歉吼,大家可以都看看,个人建议主要依照下面这个学习。

5.界面设计

程序界面设计,本人用的是PyQt5,主要是为了好看,操作起来方便,打包后方便给其他人用。这个网上的教程比较多,也比较杂,我在查询的时候感觉很是麻烦。

直到我看了这本书,它就是用PyQt designer配合使用的,正好我一直是用designer设计界面,这样不用自己记住那么多函数或者属性,所以我比较喜欢这本书。

这里还有个小tips,就是你可以去网页上找比教好看的控件,然后复制他的CSS样式,直接放在你设计的界面中excel数据分析自动化,省好多力气哦。

另外,关于界面设计的内容,可以去我的专栏中看看,里面有几个案例分享~~~

6.程序打包

关于程序打包,python使用最多的就是pyinstaller,这个没什么书,基本百度个教程就能用了。给大家上个简易的教程:

主要的坑在打包之后你的程序会非常大,运行速度极其慢,这是因为pyinstaller会把所有的包都打包进去,导致程序运行慢,所以推荐大家使用anaconda这个包管理器进行。

首选你需要安装anaconda包管理器,安装的教程如下:

2. 如何使用anaconda对环境进行管理(chongyongdemingling),可以看这个教程:

3. pyinstaller 打包示例(假设用到了openpyxl这个模块写了个数据处理的小程序):

创建一个名为pack的环境,python版本为3.7.4,环境生成时安装pyinstaller和openpyxl。

conda create --name pack  python=3.7.4 pyinstaller openpyxl

定位到程序所在的文件夹

cd c:/users/program  

进行打包(对名为station的py程序进行打包,打包成功之后就可以在dist文件夹中找到程序了,其中-F表示打包成单个可执行文件,-D表示产生一个目录,运算速度快些)

pyinstaller -F station.py

学会了以上部分,基本你的就可以轻松制作办公自动化的程序了。如果本文对你有帮助,不要忘记点赞收藏哦。

来源【大数据】,更多内容/合作请关注「运营见识」公众号,赠文案训练手册电子书。

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论