Python与数据分析应用-Intro
Intro我经常跟别的专业的同学说,没事儿可以自己学学Py,以后打工的话帮助很大。这也是我暑假打工三个月之后最大的感受。
对于初学者来说,Py最方便的地方就是有很多第三方包。你可以理解为,别人把那些很复杂的功能写好后,打包成几句代码;我们不用去考虑背后复杂的逻辑、速度、资源占用等问题,直接拿来用就行。这个系列里,我会重点介绍pandas表格处理包和matplotlib画图包,也会提到其他一些诸如scikit_learn机器学习包等一些常用的包,并且讲讲快速上手这些包的方法——查文档。这里引用一句Howard的话:
关于用py和这些包到底能干点啥……先拿pandas举个简单的例子,我想把下面这个表格里所有包含空值的行全部删掉:
# 第一步:导入表处理工具pandas. #为了简化我们的代码,我们给他取个别名叫pdimport pandas as pd# 第二步:用pandas打开一个Excel表格data = pd.read_excel('房子.xlsx')# 第三步:删去所有包含空值的行data.dropna(axis=0, inplace=True)# dropna(Drop ...