在数据分析处理过程中,首要问题就是对于数据源的承载。承载数据源有多种承载方式,本书中主要采用 Excel 电子表格文件进行数据源的承载。
对于 Excel 电子表格的手工操作,我们归纳一下,主要是文件的创建;文件的打开;文件的保存等三大主要操作方式。随后就是对于 Excel 电子表格的具体操作,如:数据计算;函数填充;数据排序;数据筛选;数据分类汇总等等一系列操作。对于少量数据而言,Excel 电子表格无疑给我们的工作带来了很大的便利,但对于大数据处理分析而言,手工操作就显然难以满足我们的需要,因此,用程序控制Excel 电子表格,摆脱手工操作就成为了我们工作的首选。
本章以 Python 语言为基础,以程序控制 Excel 电子表格为目的,详细介绍如何使数据处理自动化,摆脱并替换手工操作 Excel电子表格,从而发挥 Python 语言的强大功效,为数据处理分析提供一种简单实用的方法。
本章主要使用 pandas 第三方库来讲解。Pandas 库是目前比较流行的第三方库,比较 xlrd库、xlwt 库而言,pandas 库更新,更多功能。如在数据可视化处理方面,pandas 库是应用最多的第三方库。 pandas 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas 提供了大量能使我们快速便捷地处理数据的函数和方法,是使 Python 成为强大而高效的数据分析环境的重要因素之一。
本章详细讲述了 pandas 的基本操作、数据分析统计、csv、tsv、txt 文件与 Excel文件的区别与联系、有关工作表中行和列的操作。基本上涵盖了 Excel 的全部基本操作。
实例01:创建文件(无数据工作簿)
题目:在D:盘abc文件夹下创建一个空的工作簿,并命名名为“311.xlsx”保存。
- import pandas as pd #调用库
- df=pd.DataFrame() #创建空的Excel表格
- df.to_excel('d:/abc/311.xlsx') #保存位置
教学视频:
/Upload/image/20220807084119_6679.mp4
实例02:创建文件(有数据工作簿)
题目:在D:盘abc文件夹下创建一个有内容的的工作簿,并命名为“312.xlsx”保存。
- import pandas as pd #调用库
- df=pd.DataFrame({'品名':['怡宝','农夫山泉','屈臣氏'],'单位':['瓶','瓶','瓶'],\
- '单价':[1.6,1.6,2.5]})
- df.to_excel('d:/abc/312.xlsx') #保存位置
教学视频:
/Upload/image/20220807084310_0872.mp4
实例03:创建文件(带索引的工作簿)
题目:在实例02的基础上将第2列(B列)设置为索引,并命名为“313.xlsx”保存。
- import pandas as pd #调用库
- df=pd.DataFrame({'品名':['怡宝','农夫山泉','屈臣氏'],'单位':['瓶','瓶','瓶'],\
- '单价':[1.6,1.6,2.5]})
- df=df.set_index('品名') #将“品名”设置为索引
- df.to_excel('d:/abc/313.xlsx') #保存位置
教学视频:
/Upload/image/20220807084539_2874.mp4
实例04:判断工作表中数据内容的行数和列数
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,并打开其中的“饮料全表”工作表,然后给出该工作表中数据的行数和列数,标题及其内容。
- import pandas as pd #调用库
- pe=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')
- print(pe.shape) #显示总行数及总列数
- print(pe.columns) #显示行的名称
- print(pe.head()) #显示其内容
教学视频:
/Upload/image/20220811190213_2152.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,并打开其中的“饮料全表”工作表,显示其中的前2行及最后3行数据内容。
- import pandas as pd #调用库
- pe=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')
- print(pe.head(2)) #显示前2行内容
- print('=========================')
- print(pe.tail(3)) #显示后3行内容
教学视频:
/Upload/image/20220811190338_3444.mp4
题目:在D:盘abc文件夹中创建名为“316.xlsx”的工作簿,并将数据输入其工作表data中。
- from xlwt import *
- file=Workbook() #创建工作簿
- table=file.add_sheet('data') #创建工作表
- xsqk={"品名":["单位","单价","容量","数量","总价"],
- "怡宝":["瓶",1.6,"350ml",50],
- "农夫山泉":["瓶",1.6,"380ml",50],
- "屈臣氏":["瓶",2.5,"400ml",50],
- "加多宝":["瓶",5.5,"500ml",30],
- "可口可乐":["瓶",2.8,"330ml",40],
- "椰树椰汁":["听",4.6,"245ml",60],
- "美汁源":["瓶",4,"330ml",60],
- "雪碧":["听",2.9,"330ml",60],
- "红牛饮料":["听",6.9,"250ml",30]}
- num=[]
- for a in xsqk: #取出key存入列表num中
- num.append(a)
- ldata=[]
- for x in num: #将字典中的key和value分批保存到列表中
- t=[(x)]
- for a in xsqk[x]:
- t.append(a)
- ldata.append(t) #将key和value存入列表ldata中
- for i,p in enumerate(ldata): #写入文件
- for j,q in enumerate(p):
- table.write(i,j,q)
- file.save('d:\\abc\\316.xlsx') #保存文件
教学视频:
/Upload/image/20220811190524_7054.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“饮料全表”工作表,计算其中每种商品的总价,并将工作簿以“317.xlsx”为名进行保存。
- import pandas as pd
- books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')
- books['总价']=books['单价']*books['数量'] #计算
- books.to_excel('d:/abc/317.xlsx') #保存位置
教学视频:
/Upload/image/20220811190643_7875.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“销售报表”工作表,将其中的“销售日期”数据从2018-01-01开始填充,步长设为一天,最后将工作簿以“318.xlsx”为名进行保存。
- import pandas as pd
- from datetime import date,timedelta
- books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='销售报表',\
- dtype={'销售日期':str}) #打开工作簿
- start=date(2018,1,1)
- for i in books.index:
- books["销售日期"].at[i]=start+timedelta(days=i)
- books.to_excel('d:/abc/318.xlsx') #保存位置
教学视频:
/Upload/image/20220811190801_6180.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“销售报表”工作表,将其中所有的“销售日期”数据从2018-01-01开始填充,步长设为一年,最后将工作簿以“319.xlsx”为名进行保存。
- import pandas as pd
- from datetime import date,timedelta
- books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='销售报表',\
- dtype={'销售日期':str}) #打开工作簿
- start=date(2018,1,1)
- for i in books.index:
- books["销售日期"].at[i]=date(start.year+i,start.month,start.day)
- books.to_excel('d:/abc/319.xlsx') #保存位置
教学视频:
/Upload/image/20220811190919_3272.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“销售报表”工作表,将其中所有的“销售日期”数据从2018-01-01开始填充,步长设为一个月,最后将工作簿以“3110.xlsx”为名进行保存。
- import pandas as pd
- from datetime import date,timedelta
- def mon(d,md):
- yd=md//12
- m=d.month+md%12
- if m!=12:
- yd+=m//12
- m=m%12
- return date(d.year+yd,m,d.day)
- books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='销售报表',\
- dtype={'销售日期':str}) #打开工作簿
- start=date(2018,1,1)
- for i in books.index:
- books["销售日期"].at[i]=mon(start,i)
- books.to_excel('d:/abc/3110.xlsx') #保存位置
教学视频:
/Upload/image/20220811191035_5765.mp4
实例11:函数填充(求和)
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“期末成绩”工作表,计算其中每个人的总分,并将工作簿以“3111.xlsx”为名进行保存。
- import pandas as pd
- books=pd.read_excel("d:/abc/例题锦集.xlsx",sheet_name='期末成绩')
- temp=books[['语文','数学','英语']] #提取数据
- row_sum=temp.sum(axis=1) #计算一行的总分
- books['总分']=row_sum #将总分写入“总分”列
- books.to_excel('d:/abc/3111.xlsx') #保存位置
教学视频:
/Upload/image/20220812110832_0818.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“期末成绩”工作表,计算其中每个人各科的平均分,并将工作簿以“3112.xlsx”为名进行保存。
- import pandas as pd
- books=pd.read_excel("d:/abc/例题锦集.xlsx",sheet_name='期末成绩')
- temp=books[['语文','数学','英语']] #提取数据
- row_mean=temp.mean(axis=1) #计算一行的平均分
- books['平均分']=row_mean #将平均分写入“平均分”列
- books.to_excel('d:/abc/3112.xlsx') #保存位置
教学视频:
/Upload/image/20220812110944_4108.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“饮料全表”工作表,以“单价”为关键字进行排序(升序),并将工作簿以“321.xlsx”为名进行保存。
- import pandas as pd
- books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')
- books.sort_values(by='单价',inplace=True) #排序
- books.to_excel('d:/abc/321.xlsx') #保存位置
教学视频:
/Upload/image/20220812111104_1162.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“饮料全表”工作表,以“单价”为关键字进行排序(降序),并将工作簿以“322.xlsx”为名进行保存。
- import pandas as pd
- books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')
- books.sort_values(by='单价',inplace=True,ascending=False) #排序
- books.to_excel('d:/abc/322.xlsx') #保存位置
教学视频:
/Upload/image/20220812111218_0170.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“饮料全表”工作表,以“容量”为第一关键字(升序)、以“单价”为第二关键字(降序)进行排序,并将工作簿以“323.xlsx”为名进行保存。
- import pandas as pd
- books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')
- books.sort_values(by=['容量','单价'],inplace=True,ascending=[True,False])
- books.to_excel('d:/abc/323.xlsx') #保存位置
教学视频:
/Upload/image/20220812111329_9842.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“饮料全表”工作表,将“单价”介于2~3的数据筛选出来,并将工作簿以“324.xlsx”为名进行保存。
- import pandas as pd
- def dj(x): #定义单价筛选条件
- return 2
- books=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='饮料全表')
- books=books.loc[books['单价'].apply(dj)] #以条件dj对单价进行筛选
- books.to_excel('d:/abc/324.xlsx') #保存位置
教学视频:
/Upload/image/20220812111440_1804.mp4
题目:将D:盘abc文件夹中的“饮料销售情况.xls”文件打开,并打开其中sheet1工作表,将其中的数据写入列表和字典。
- import xlrd
- data=xlrd.open_workbook('d:/abc/饮料销售情况.xls')
- table=data.sheet_by_name('sheet1')
- name=[] #设置初值(空值)
- data=[] #设置初值(空值)
- dict_data={} #设置初值(空值)
- nr=table.nrows #计算工作表总行数据
- nc=table.ncols #计算工作表总列数据
- for i in range(nr): #读取工作表数据到列表
- name.append(table.row_values(i)[0])
- data.append(table.row_values(i)[1:nc])
- print(name)
- print(data)
- print('=====================')
- dict_data=dict(zip(name,data)) #合并列表到字典
- print(dict_data)
教学视频:
/Upload/image/20220812111557_3702.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”文件打开,并打开其中的“饮料全表”工作表,将其中的数据以“单位”为依据分类汇总(求和),将工作簿以“326.xlsx”为名进行保存。
- import pandas as pd
- df=pd.read_excel('d:/abc/例题锦集.xlsx','饮料全表')
- kk=df.groupby(['单位']).sum() #按“单位”分组
- kk.to_excel('d:/abc/326.xlsx') #写入Excel文件中
教学视频:
/Upload/image/20220812111707_7918.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”文件打开,并打开其中的“饮料全表”工作表,将其中的数据以“单位”和“容量”为依据分类汇总(求和),将工作簿以“327.xlsx”为名进行保存。
- import pandas as pd
- df=pd.read_excel('d:/abc/例题锦集.xlsx','饮料全表')
- kk=df.groupby(['单位','容量']).sum() #按“单位”和“容量”分组
- kk.to_excel('d:/abc/327.xlsx')
教学视频:
/Upload/image/20220812111822_7765.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”文件打开,并打开其中的“销售报表”工作表,将其中的数据以“年份”为行,以“销售数量”为列建立数据透视表,将工作簿以“328.xlsx”为名进行保存。
- import pandas as pd
- import numpy as np
- tsb=pd.read_excel("d:/abc/例题锦集.xlsx",'销售报表')
- tsb['年份']=pd.DatetimeIndex(tsb['销售日期']).year #提取年份
- tsb1=tsb.pivot_table(index='类别',columns='年份',values='销售数量',\
- aggfunc=np.sum) #建立数据透视表
- tsb1.to_excel('d:/abc/328.xlsx')
教学视频:
/Upload/image/20220812111938_1088.mp4
实例21:数据透视表分组
题目:将D:盘abc文件夹中的“例题锦集.xlsx”文件打开,并打开其中的“销售报表”工作表,将其中的数据以“年份”为行,以“销售总额”为列,分组建立数据透视表,将工作簿以“329.xlsx”为名进行保存。
- import pandas as pd
- import numpy as np
- tsb=pd.read_excel("d:/abc/例题锦集.xlsx",'销售报表')
- tsb['年份']=pd.DatetimeIndex(tsb['销售日期']).year #提取年份
- groups=tsb.groupby(['类别','年份']) #分组
- s=groups['销售数量'].sum() #计算销售总额
- pt2=pd.DataFrame({'销售总额':s}) #合并(聚合)
- pt2.to_excel('d:/abc/329.xlsx')
教学视频:
/Upload/image/20220812211232_3283.mp4
题目:在D:盘abc文件夹中,将“学生名单.csv”文件读入Excel文件,并将工作簿以“331.xlsx”为名保存在相同文件夹中。
- import pandas as pd
- stu=pd.read_csv('d:/abc/学生名单.csv',encoding='gbk',index_col='学号') #读入csv文件
- stu.to_excel('d:/abc/331.xlsx')
教学视频:
/Upload/image/20220812211424_1509.mp4
题目:在D:盘abc文件夹中,将“学生名单.tsv”文件读入Excel文件,并将工作簿以“332.xlsx”为名保存在相同文件夹中。
- import pandas as pd
- stu=pd.read_csv('d:/abc/学生名单.tsv',sep='\t',encoding='gbk',index_col='学号') #读入tsv文件
- stu.to_excel('d:/abc/332.xlsx') #写入Excel文件中
教学视频:
/Upload/image/20220812211628_7331.mp4
题目:在D:盘abc文件夹中,将“学生名单.txt”文件读入Excel文件,并将工作簿以“333.xlsx”为名保存在相同文件夹中。
- import pandas as pd
- stu=pd.read_table('d:/abc/学生名单.txt',encoding='gbk',index_col='学号') #读入txt文件
- stu.to_excel('d:/abc/333.xlsx')
教学视频:
/Upload/image/20220812211806_6902.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中“优秀名单”“良好名单”工作表中的数据合并到一个工作表中,将工作簿以“341.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page2=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='良好名单')
- stu=page1.append(page2).reset_index(drop=True) #合并
- stu.to_excel('d:/abc/341.xlsx')
教学视频:
/Upload/image/20220812211926_9973.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“优秀名单”工作表,在数据末尾追加一行新数据,将工作簿以“342.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- stu=pd.Series({'学号':21,'姓名':'李强','成绩':91})
- students=page1.append(stu,ignore_index=True) #追加一行数据
- students.to_excel('d:/abc/342.xlsx')
教学视频:
/Upload/image/20220812212112_5699.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中的“优秀名单”工作表中的第7条数据中姓名列的“赵雪”改为“李密”,将工作簿以“343.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1.at[7,'姓名']='李密' #修改姓名列的数据
- page1.to_excel('d:/abc/343.xlsx') #写入Excel文件中
教学视频:
/Upload/image/20220812212245_6752.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“优秀名单”工作表,将其第6条姓名为“陈东”的记录替换掉,将工作簿以“344.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- stu=pd.Series({'学号':6,'姓名':'吴伟','成绩':97})
- page1.iloc[5]=stu #替换整行数据
- page1.to_excel('d:/abc/344.xlsx')
教学视频:
/Upload/image/20220812212409_2781.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“优秀名单”工作表,在其第3条记录下面插入一条新记录,将工作簿以“345.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- stu=pd.Series({'学号':101,'姓名':'吴伟','成绩':97})
- pa1=page1[:3] #进行切片操作(左闭右开)
- pa2=page1[3:] #进行切片操作(左开右闭)
- students=pa1.append(stu,ignore_index=True).append(pa2).\
- reset_index(drop=True) #进行组合
- students.to_excel('d:/abc/345.xlsx')
教学视频:
/Upload/image/20220812212532_0635.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“优秀名单”工作表,将其第3行至第6行的4条数据删除,将工作簿以“346.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1.drop(index=[2,3,4,5],inplace=True) #删除
- page1.to_excel('d:/abc/346.xlsx')
教学视频:
/Upload/image/20220812212656_0956.mp4
实例31:删除整行数据(按指定范围删除)
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“优秀名单”工作表,将其第3条至第6条的4条记录删除,将工作簿以“347.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1.drop(index=range(2,6),inplace=True) #删除
- page1.to_excel('d:/abc/347.xlsx')
教学视频:
/Upload/image/20220813095419_1710.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“优秀名单”工作表,将第3行至第6行的4条数据删除,将工作簿以“348.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1.drop(index=page1[2:6].index,inplace=True) #按切片进行删除
- page1.to_excel('d:/abc/348.xlsx')
教学视频:
/Upload/image/20220813095543_3709.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,同时打开其中的“优秀名单”工作表,将人员中姓“李”的记录按条件方式进行删除,并重新设置索引,最后将工作簿以“349.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- miss=page1.loc[page1['姓名'].str[0:1]=='李'] #筛选数据
- page1.drop(index=miss.index,inplace=True) #有条件地进行删除
- students=page1.reset_index(drop=True) #重新设置索引
- students.to_excel('d:/abc/349.xlsx')
教学视频:
/Upload/image/20220813095704_0835.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中“优秀名单”“良好名单”工作表中的数据以列的方式合并到一个工作表中,将工作簿以“351.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page2=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='良好名单')
- stu=pd.concat((page1,page2),axis=1) #合并工作表
- stu.to_excel('d:/abc/351.xlsx')
教学视频:
/Upload/image/20220813095821_3857.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中的“优秀名单”工作表打开,在其数据列的右侧加入一列,命名为“年龄”,其数据内容均为25,并将工作簿以“352.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1['年龄']=25 #追加列数据
- page1.to_excel('d:/abc/352.xlsx')
教学视频:
/Upload/image/20220813095933_0299.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中的“优秀名单”工作表打开,在“成绩”列右侧加入一列,命名为“名次”,其数据内容为一数字序列,并将工作簿以“353.xlsx”为名进行保存。
- import pandas as pd
- import numpy as np
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1['名次']=np.arange(1,len(page1)+1) #追加列数据
- page1.to_excel('d:/abc/353.xlsx')
教学视频:
/Upload/image/20220813100045_4438.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中的“优秀名单”工作表打开,将其最右侧的名为“成绩”的一列数据内容删除,将工作簿以“354.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1.drop(columns='成绩',inplace=True) #删除列数据
- page1.to_excel('d:/abc/354.xlsx')
教学视频:
/Upload/image/20220813100153_3048.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中的“优秀名单”工作表打开,在其最右侧名为“成绩”的数据列的左侧插入一列名字为“年龄”的列数据,其数据内容为25,将工作簿以“355.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1.insert(2,column="年龄",value=25) #插入列数据
- page1.to_excel('d:/abc/355.xlsx')
教学视频:
/Upload/image/20220813100332_4374.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中的“优秀名单”工作表打开,将其最右侧名为“成绩”的列标题改为“期末成绩”,将工作簿以“356.xlsx”为名进行保存。
- import pandas as pd
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1.rename(columns={"成绩":"期末成绩"},inplace=True) #修改列标题
- page1.to_excel('d:/abc/356.xlsx')
教学视频:
/Upload/image/20220813100504_8477.mp4
题目:将D:盘abc文件夹中的“例题锦集.xlsx”打开,将其中的“优秀名单”工作表打开,将第3~6行的“学号”列数据置为空,然后删除空值所在行,将工作簿以“357.xlsx”为名进行保存。
- import pandas as pd
- import numpy as np
- page1=pd.read_excel('d:/abc/例题锦集.xlsx',sheet_name='优秀名单')
- page1['学号']=page1['学号'].astype(float) #转换为浮点数
- for i in range(3,7): #将数据填充为空值
- page1['学号'].at[i]=np.nan
- page1.dropna(inplace=True) #删除工作表中的空值
- page1.to_excel('d:/abc/357.xlsx')
教学视频:
/Upload/image/20220813100618_4813.mp4
<本 章 完>
还可以输入200个字
蝈蝈派【海南省教改项目(Hnjg2022-80)支持】 网站版权所有
Python remained the copyright of our website