第 3 章 Python 办公自动化之 pandas 库——Python办公自动化|python基础|

第 3 章 Python 办公自动化之 pandas 库——Python办公自动化

中中

2022/8/7 21:46:07

576 阅读

在数据分析处理过程中，首要问题就是对于数据源的承载。承载数据源有多种承载方式，本书中主要采用 Excel 电子表格文件进行数据源的承载。

对于 Excel 电子表格的手工操作，我们归纳一下，主要是文件的创建；文件的打开；文件的保存等三大主要操作方式。随后就是对于 Excel 电子表格的具体操作，如：数据计算；函数填充；数据排序；数据筛选；数据分类汇总等等一系列操作。对于少量数据而言，Excel 电子表格无疑给我们的工作带来了很大的便利，但对于大数据处理分析而言，手工操作就显然难以满足我们的需要，因此，用程序控制Excel 电子表格，摆脱手工操作就成为了我们工作的首选。

本章以 Python 语言为基础，以程序控制 Excel 电子表格为目的，详细介绍如何使数据处理自动化，摆脱并替换手工操作 Excel电子表格，从而发挥 Python 语言的强大功效，为数据处理分析提供一种简单实用的方法。

本章主要使用 pandas 第三方库来讲解。Pandas 库是目前比较流行的第三方库，比较 xlrd库、xlwt 库而言，pandas 库更新，更多功能。如在数据可视化处理方面，pandas 库是应用最多的第三方库。 pandas 是基于 NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas 提供了大量能使我们快速便捷地处理数据的函数和方法，是使 Python 成为强大而高效的数据分析环境的重要因素之一。

本章详细讲述了 pandas 的基本操作、数据分析统计、csv、tsv、txt 文件与 Excel文件的区别与联系、有关工作表中行和列的操作。基本上涵盖了 Excel 的全部基本操作。

实例01：创建文件(无数据工作簿)

题目：在D:盘abc文件夹下创建一个空的工作簿，并命名名为“311.xlsx”保存。

																				import pandas as pd                 #调用库		
					df=pd.DataFrame()                   #创建空的Excel表格		
					df.to_excel('d:/abc/311.xlsx')   #保存位置

教学视频：

/Upload/image/20220807084119_6679.mp4

实例02：创建文件(有数据工作簿)

题目：在D:盘abc文件夹下创建一个有内容的的工作簿，并命名为“312.xlsx”保存。

																				import pandas as pd                #调用库		
					df=pd.DataFrame({'品名':['怡宝','农夫山泉','屈臣氏'],'单位':['瓶','瓶','瓶'],\		
					                 '单价':[1.6,1.6,2.5]})		
					df.to_excel('d:/abc/312.xlsx')   #保存位置

教学视频：

/Upload/image/20220807084310_0872.mp4

实例03：创建文件(带索引的工作簿)

题目：在实例02的基础上将第2列(B列)设置为索引，并命名为“313.xlsx”保存。

																				import pandas as pd                #调用库		
					df=pd.DataFrame({'品名':['怡宝','农夫山泉','屈臣氏'],'单位':['瓶','瓶','瓶'],\		
					                 '单价':[1.6,1.6,2.5]})		
					df=df.set_index('品名')            #将“品名”设置为索引		
							
					df.to_excel('d:/abc/313.xlsx')   #保存位置

教学视频：

/Upload/image/20220807084539_2874.mp4

实例04：判断工作表中数据内容的行数和列数

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，并打开其中的“饮料全表”工作表，然后给出该工作表中数据的行数和列数，标题及其内容。

																				import pandas as pd         #调用库		
							
					pe=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')		
							
					print(pe.shape)            #显示总行数及总列数		
					print(pe.columns)          #显示行的名称		
							
					print(pe.head())           #显示其内容

教学视频：

/Upload/image/20220811190213_2152.mp4

实例05：显示工作表中数据的部分内容

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，并打开其中的“饮料全表”工作表，显示其中的前2行及最后3行数据内容。

																				import pandas as pd            #调用库		
							
					pe=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')		
							
					print(pe.head(2))               #显示前2行内容		
					print('=========================')		
					print(pe.tail(3))                #显示后3行内容

教学视频：

/Upload/image/20220811190338_3444.mp4

实例06：在工作表中填加数据

题目：在D:盘abc文件夹中创建名为“316.xlsx”的工作簿，并将数据输入其工作表data中。

																				from xlwt import *		
					file=Workbook()                   #创建工作簿		
					table=file.add_sheet('data')            #创建工作表		
							
					xsqk={"品名":["单位","单价","容量","数量","总价"],		
					"怡宝":["瓶",1.6,"350ml",50],		
					"农夫山泉":["瓶",1.6,"380ml",50],		
					"屈臣氏":["瓶",2.5,"400ml",50],		
					"加多宝":["瓶",5.5,"500ml",30],		
					"可口可乐":["瓶",2.8,"330ml",40],		
					"椰树椰汁":["听",4.6,"245ml",60],		
					"美汁源":["瓶",4,"330ml",60],		
					"雪碧":["听",2.9,"330ml",60],		
					"红牛饮料":["听",6.9,"250ml",30]}		
							
					num=[]                    		
					for a in xsqk:                    #取出key存入列表num中 		
					  num.append(a)		
							
					ldata=[]		
					for x in num:                    #将字典中的key和value分批保存到列表中		
					  t=[(x)]		
					  for a in xsqk[x]:		
					      t.append(a)		
					  ldata.append(t)                #将key和value存入列表ldata中		
							
					for i,p in enumerate(ldata):         #写入文件		
					  for j,q in enumerate(p):		
					      table.write(i,j,q)		
							
					file.save('d:\\abc\\316.xlsx')        #保存文件

教学视频：

/Upload/image/20220811190524_7054.mp4

实例07：工作表中数据的计算

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“饮料全表”工作表，计算其中每种商品的总价，并将工作簿以“317.xlsx”为名进行保存。

																				import pandas as pd		
					books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表') 		
					books['总价']=books['单价']*books['数量']      #计算		
							
					books.to_excel('d:/abc/317.xlsx')             #保存位置

教学视频：

/Upload/image/20220811190643_7875.mp4

实例08：填充日期序列

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“销售报表”工作表，将其中的“销售日期”数据从2018-01-01开始填充，步长设为一天，最后将工作簿以“318.xlsx”为名进行保存。

																				import pandas as pd		
					from datetime import date,timedelta		
					books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='销售报表',\		
					                    dtype={'销售日期':str})   #打开工作簿		
							
					start=date(2018,1,1)		
					for i in books.index:		
					    books["销售日期"].at[i]=start+timedelta(days=i)		
							
					books.to_excel('d:/abc/318.xlsx')            #保存位置

教学视频：

/Upload/image/20220811190801_6180.mp4

实例09：填充年份序列

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“销售报表”工作表，将其中所有的“销售日期”数据从2018-01-01开始填充，步长设为一年，最后将工作簿以“319.xlsx”为名进行保存。

																				import pandas as pd		
					from datetime import date,timedelta		
					books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='销售报表',\		
					                    dtype={'销售日期':str})    #打开工作簿		
							
					start=date(2018,1,1)		
					for i in books.index:		
					    books["销售日期"].at[i]=date(start.year+i,start.month,start.day)		
							
					books.to_excel('d:/abc/319.xlsx')            #保存位置

教学视频：

/Upload/image/20220811190919_3272.mp4

实例10：填充月份序列

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“销售报表”工作表，将其中所有的“销售日期”数据从2018-01-01开始填充，步长设为一个月，最后将工作簿以“3110.xlsx”为名进行保存。

															import pandas as pd		
					from datetime import date,timedelta		
							
					def mon(d,md):		
					    yd=md//12		
					    m=d.month+md%12		
					    if m!=12:		
					        yd+=m//12		
					        m=m%12		
					    return date(d.year+yd,m,d.day)		
							
					books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='销售报表',\		
					                    dtype={'销售日期':str})    #打开工作簿		
							
					start=date(2018,1,1)		
					for i in books.index:		
					    books["销售日期"].at[i]=mon(start,i)		
							
					books.to_excel('d:/abc/3110.xlsx')           #保存位置

教学视频：

/Upload/image/20220811191035_5765.mp4

实例11：函数填充(求和)

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“期末成绩”工作表，计算其中每个人的总分，并将工作簿以“3111.xlsx”为名进行保存。

															import pandas as pd		
					books=pd.read_excel("d:/abc/例题锦集.xlsx",sheet_name='期末成绩')		
							
					temp=books[['语文','数学','英语']]           #提取数据		
					row_sum=temp.sum(axis=1)               #计算一行的总分		
					books['总分']=row_sum                   #将总分写入“总分”列		
							
					books.to_excel('d:/abc/3111.xlsx')           #保存位置

教学视频：

/Upload/image/20220812110832_0818.mp4

实例12：函数填充(平均值)

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“期末成绩”工作表，计算其中每个人各科的平均分，并将工作簿以“3112.xlsx”为名进行保存。

															import pandas as pd		
							
					books=pd.read_excel("d:/abc/例题锦集.xlsx",sheet_name='期末成绩')		
							
					temp=books[['语文','数学','英语']]            #提取数据		
					row_mean=temp.mean(axis=1)              #计算一行的平均分		
					books['平均分']=row_mean                #将平均分写入“平均分”列		
							
					books.to_excel('d:/abc/3112.xlsx')           #保存位置

教学视频：

/Upload/image/20220812110944_4108.mp4

实例13：排序(升序排列)

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“饮料全表”工作表，以“单价”为关键字进行排序（升序），并将工作簿以“321.xlsx”为名进行保存。

															import pandas as pd		
					books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表') 		
					books.sort_values(by='单价',inplace=True)        #排序		
							
					books.to_excel('d:/abc/321.xlsx')                #保存位置

教学视频：

/Upload/image/20220812111104_1162.mp4

实例14：排序(降序排列)

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“饮料全表”工作表，以“单价”为关键字进行排序（降序），并将工作簿以“322.xlsx”为名进行保存。

															import pandas as pd		
					books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')		
					books.sort_values(by='单价',inplace=True,ascending=False)      #排序		
							
					books.to_excel('d:/abc/322.xlsx')                           #保存位置

教学视频：

/Upload/image/20220812111218_0170.mp4

实例15：多重排序

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“饮料全表”工作表，以“容量”为第一关键字（升序）、以“单价”为第二关键字（降序）进行排序，并将工作簿以“323.xlsx”为名进行保存。

															import pandas as pd		
					books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')		
					books.sort_values(by=['容量','单价'],inplace=True,ascending=[True,False]) 		
							
					books.to_excel('d:/abc/323.xlsx')   #保存位置

教学视频：

/Upload/image/20220812111329_9842.mp4

实例16：数据筛选

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“饮料全表”工作表，将“单价”介于2～3的数据筛选出来，并将工作簿以“324.xlsx”为名进行保存。

															import pandas as pd		
							
					def dj(x):                                #定义单价筛选条件		
					    return  2		
							
					books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')  		
					books=books.loc[books['单价'].apply(dj)]       #以条件dj对单价进行筛选		
							
					books.to_excel('d:/abc/324.xlsx')             #保存位置

教学视频：

/Upload/image/20220812111440_1804.mp4

实例17：提取工作表数据到列表和字典中

题目：将D:盘abc文件夹中的“饮料销售情况.xls”文件打开，并打开其中sheet1工作表，将其中的数据写入列表和字典。

															import xlrd                           		
					data=xlrd.open_workbook('d:/abc/饮料销售情况.xls') 		
					table=data.sheet_by_name('sheet1')             		
					name=[]                          #设置初值（空值）		
					data=[]                           #设置初值（空值）		
					dict_data={}                      #设置初值（空值）		
					nr=table.nrows                     #计算工作表总行数据		
					nc=table.ncols                     #计算工作表总列数据		
					for i in range(nr):                    #读取工作表数据到列表		
					    name.append(table.row_values(i)[0])		
					    data.append(table.row_values(i)[1:nc])		
					print(name)		
					print(data)		
					print('=====================')		
					dict_data=dict(zip(name,data))         #合并列表到字典		
					print(dict_data)

教学视频：

/Upload/image/20220812111557_3702.mp4

实例18：数据分类汇总(按字符型汇总)

题目：将D:盘abc文件夹中的“例题锦集.xlsx”文件打开，并打开其中的“饮料全表”工作表，将其中的数据以“单位”为依据分类汇总（求和），将工作簿以“326.xlsx”为名进行保存。

															import pandas as pd		
							
					df=pd.read_excel('d:/abc/例题锦集.xlsx','饮料全表') 		
							
					kk=df.groupby(['单位']).sum()      #按“单位”分组		
							
					kk.to_excel('d:/abc/326.xlsx')       #写入Excel文件中

教学视频：

/Upload/image/20220812111707_7918.mp4

实例19：数据分类汇总(按数值型汇总)

题目：将D:盘abc文件夹中的“例题锦集.xlsx”文件打开，并打开其中的“饮料全表”工作表，将其中的数据以“单位”和“容量”为依据分类汇总（求和），将工作簿以“327.xlsx”为名进行保存。

															import pandas as pd		
							
					df=pd.read_excel('d:/abc/例题锦集.xlsx','饮料全表') 		
							
					kk=df.groupby(['单位','容量']).sum()     #按“单位”和“容量”分组		
							
					kk.to_excel('d:/abc/327.xlsx')

教学视频：

/Upload/image/20220812111822_7765.mp4

实例20：创建数据透视表

题目：将D:盘abc文件夹中的“例题锦集.xlsx”文件打开，并打开其中的“销售报表”工作表，将其中的数据以“年份”为行，以“销售数量”为列建立数据透视表，将工作簿以“328.xlsx”为名进行保存。

															import pandas as pd		
					import numpy as np		
					tsb=pd.read_excel("d:/abc/例题锦集.xlsx",'销售报表')		
							
					tsb['年份']=pd.DatetimeIndex(tsb['销售日期']).year       #提取年份		
							
					tsb1=tsb.pivot_table(index='类别',columns='年份',values='销售数量',\		
					                     aggfunc=np.sum)            #建立数据透视表		
							
					tsb1.to_excel('d:/abc/328.xlsx')

教学视频：

/Upload/image/20220812111938_1088.mp4

实例21：数据透视表分组

题目：将D:盘abc文件夹中的“例题锦集.xlsx”文件打开，并打开其中的“销售报表”工作表，将其中的数据以“年份”为行，以“销售总额”为列，分组建立数据透视表，将工作簿以“329.xlsx”为名进行保存。

												import pandas as pd		
					import numpy as np		
					tsb=pd.read_excel("d:/abc/例题锦集.xlsx",'销售报表')		
							
					tsb['年份']=pd.DatetimeIndex(tsb['销售日期']).year      #提取年份		
							
					groups=tsb.groupby(['类别','年份'])                   #分组		
					s=groups['销售数量'].sum()                         #计算销售总额		
							
					pt2=pd.DataFrame({'销售总额':s})                   #合并（聚合）		
							
					pt2.to_excel('d:/abc/329.xlsx')

教学视频：

/Upload/image/20220812211232_3283.mp4

实例22：读取csv文件内容到Excel文件中

题目：在D:盘abc文件夹中，将“学生名单.csv”文件读入Excel文件，并将工作簿以“331.xlsx”为名保存在相同文件夹中。

												import pandas as pd		
					stu=pd.read_csv('d:/abc/学生名单.csv',encoding='gbk',index_col='学号') #读入csv文件		
							
					stu.to_excel('d:/abc/331.xlsx')

教学视频：

/Upload/image/20220812211424_1509.mp4

实例23：读取tsv文件内容到Excel文件中

题目：在D:盘abc文件夹中，将“学生名单.tsv”文件读入Excel文件，并将工作簿以“332.xlsx”为名保存在相同文件夹中。

												import pandas as pd		
					stu=pd.read_csv('d:/abc/学生名单.tsv',sep='\t',encoding='gbk',index_col='学号') #读入tsv文件		
							
					stu.to_excel('d:/abc/332.xlsx')   #写入Excel文件中

教学视频：

/Upload/image/20220812211628_7331.mp4

实例24：读取txt文件内容到Excel文件中

题目：在D:盘abc文件夹中，将“学生名单.txt”文件读入Excel文件，并将工作簿以“333.xlsx”为名保存在相同文件夹中。

												import pandas as pd		
					stu=pd.read_table('d:/abc/学生名单.txt',encoding='gbk',index_col='学号') #读入txt文件		
							
					stu.to_excel('d:/abc/333.xlsx')

教学视频：

/Upload/image/20220812211806_6902.mp4

实例25：合并两个工作表

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中“优秀名单”“良好名单”工作表中的数据合并到一个工作表中，将工作簿以“341.xlsx”为名进行保存。

												import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					page2=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='良好名单')		
							
					stu=page1.append(page2).reset_index(drop=True)   #合并		
							
					stu.to_excel('d:/abc/341.xlsx')

教学视频：

/Upload/image/20220812211926_9973.mp4

实例26：向工作表中追加数据

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“优秀名单”工作表，在数据末尾追加一行新数据，将工作簿以“342.xlsx”为名进行保存。

												import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					stu=pd.Series({'学号':21,'姓名':'李强','成绩':91})		
							
					students=page1.append(stu,ignore_index=True)   #追加一行数据		
							
					students.to_excel('d:/abc/342.xlsx')

教学视频：

/Upload/image/20220812212112_5699.mp4

实例27：修改工作表中的数据

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中的“优秀名单”工作表中的第7条数据中姓名列的“赵雪”改为“李密”，将工作簿以“343.xlsx”为名进行保存。

												import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					page1.at[7,'姓名']='李密'   #修改姓名列的数据		
							
					page1.to_excel('d:/abc/343.xlsx')       #写入Excel文件中

教学视频：

/Upload/image/20220812212245_6752.mp4

实例28：替换整行数据

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“优秀名单”工作表，将其第6条姓名为“陈东”的记录替换掉，将工作簿以“344.xlsx”为名进行保存。

												import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					stu=pd.Series({'学号':6,'姓名':'吴伟','成绩':97})		
							
					page1.iloc[5]=stu           #替换整行数据		
							
					page1.to_excel('d:/abc/344.xlsx')

教学视频：

/Upload/image/20220812212409_2781.mp4

实例29：插入整行数据

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“优秀名单”工作表，在其第3条记录下面插入一条新记录，将工作簿以“345.xlsx”为名进行保存。

												import pandas as pd		
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
							
					stu=pd.Series({'学号':101,'姓名':'吴伟','成绩':97})		
							
					pa1=page1[:3]                       #进行切片操作（左闭右开）		
					pa2=page1[3:]                       #进行切片操作（左开右闭）		
							
					students=pa1.append(stu,ignore_index=True).append(pa2).\		
					          reset_index(drop=True)      #进行组合		
							
					students.to_excel('d:/abc/345.xlsx')

教学视频：

/Upload/image/20220812212532_0635.mp4

实例30：删除整行数据(按指定行删除)

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“优秀名单”工作表，将其第3行至第6行的4条数据删除，将工作簿以“346.xlsx”为名进行保存。

												import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
							
					page1.drop(index=[2,3,4,5],inplace=True)    #删除		
							
					page1.to_excel('d:/abc/346.xlsx')

教学视频：

/Upload/image/20220812212656_0956.mp4

实例31：删除整行数据（按指定范围删除）

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“优秀名单”工作表，将其第3条至第6条的4条记录删除，将工作簿以“347.xlsx”为名进行保存。

											import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
							
					page1.drop(index=range(2,6),inplace=True)    #删除		
							
					page1.to_excel('d:/abc/347.xlsx')

教学视频：

/Upload/image/20220813095419_1710.mp4

实例32：删除整行数据（按切片方式删除）

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“优秀名单”工作表，将第3行至第6行的4条数据删除，将工作簿以“348.xlsx”为名进行保存。

											import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
							
					page1.drop(index=page1[2:6].index,inplace=True)    #按切片进行删除		
							
					page1.to_excel('d:/abc/348.xlsx')

教学视频：

/Upload/image/20220813095543_3709.mp4

实例33：有条件地删除整行数据

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，同时打开其中的“优秀名单”工作表，将人员中姓“李”的记录按条件方式进行删除，并重新设置索引，最后将工作簿以“349.xlsx”为名进行保存。

											import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
							
					miss=page1.loc[page1['姓名'].str[0:1]=='李']     #筛选数据		
							
					page1.drop(index=miss.index,inplace=True)     #有条件地进行删除		
					students=page1.reset_index(drop=True)        #重新设置索引		
							
					students.to_excel('d:/abc/349.xlsx')

教学视频：

/Upload/image/20220813095704_0835.mp4

实例34：以列的方式合并两个工作表

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中“优秀名单”“良好名单”工作表中的数据以列的方式合并到一个工作表中，将工作簿以“351.xlsx”为名进行保存。

											import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					page2=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='良好名单')		
							
					stu=pd.concat((page1,page2),axis=1)      #合并工作表		
							
					stu.to_excel('d:/abc/351.xlsx')

教学视频：

/Upload/image/20220813095821_3857.mp4

实例35：追加列数据（追加空列）

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中的“优秀名单”工作表打开，在其数据列的右侧加入一列，命名为“年龄”，其数据内容均为25，并将工作簿以“352.xlsx”为名进行保存。

											import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					page1['年龄']=25                   #追加列数据		
							
					page1.to_excel('d:/abc/352.xlsx')

教学视频：

/Upload/image/20220813095933_0299.mp4

实例36：追加列数据（追加并填充数据）

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中的“优秀名单”工作表打开，在“成绩”列右侧加入一列，命名为“名次”，其数据内容为一数字序列，并将工作簿以“353.xlsx”为名进行保存。

											import pandas as pd		
					import numpy as np		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					page1['名次']=np.arange(1,len(page1)+1)    #追加列数据		
							
					page1.to_excel('d:/abc/353.xlsx')

教学视频：

/Upload/image/20220813100045_4438.mp4

实例37：删除列数据

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中的“优秀名单”工作表打开，将其最右侧的名为“成绩”的一列数据内容删除，将工作簿以“354.xlsx”为名进行保存。

											import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					page1.drop(columns='成绩',inplace=True)   #删除列数据		
							
					page1.to_excel('d:/abc/354.xlsx')

教学视频：

/Upload/image/20220813100153_3048.mp4

实例38：插入列数据

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中的“优秀名单”工作表打开，在其最右侧名为“成绩”的数据列的左侧插入一列名字为“年龄”的列数据，其数据内容为25，将工作簿以“355.xlsx”为名进行保存。

												import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					page1.insert(2,column="年龄",value=25)       #插入列数据		
							
					page1.to_excel('d:/abc/355.xlsx')

教学视频：

/Upload/image/20220813100332_4374.mp4

实例39：修改列标题

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中的“优秀名单”工作表打开，将其最右侧名为“成绩”的列标题改为“期末成绩”，将工作簿以“356.xlsx”为名进行保存。

												import pandas as pd		
							
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
					page1.rename(columns={"成绩":"期末成绩"},inplace=True)   #修改列标题		
							
					page1.to_excel('d:/abc/356.xlsx')

教学视频：

/Upload/image/20220813100504_8477.mp4

实例40：删除空值

题目：将D:盘abc文件夹中的“例题锦集.xlsx”打开，将其中的“优秀名单”工作表打开，将第3～6行的“学号”列数据置为空，然后删除空值所在行，将工作簿以“357.xlsx”为名进行保存。

												import pandas as pd		
					import numpy as np		
					page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')		
							
					page1['学号']=page1['学号'].astype(float)     #转换为浮点数		
					for i in range(3,7):                        #将数据填充为空值		
					    page1['学号'].at[i]=np.nan		
							
					page1.dropna(inplace=True)               #删除工作表中的空值		
							
					page1.to_excel('d:/abc/357.xlsx')

教学视频：

/Upload/image/20220813100618_4813.mp4

<本章完>

还可以输入200个字

实例32：删除整行数据（按切片方式删除）

实例33：有条件地删除整行数据

实例34： 以列的方式合并两个工作表

实例35： 追加列数据（追加空列）

实例36：追加列数据（追加并填充数据）

实例37： 删除列数据

实例38：插入列数据

实例39： 修改列标题

实例40：删除空值

实例34：以列的方式合并两个工作表

实例35：追加列数据（追加空列）

实例37：删除列数据

实例39：修改列标题