基于Python的大数据分析及实战
当前位置:首页 > 数据分析
基于Python的大数据分析及实战

本站编辑

2022/7/8 0:00:00

按要求完成如下任务

利用pandas的文件读取功能打开iris.csv文件
获取数据后,显示数据的后7行

In [2]:
iris = pd.read_csv('iris.csv') iris.tail(7) 
Out[2]:
Unnamed: 0 Sepal.Length Sepal.Width Petal.Length Petal.Width Species
143 144 6.8 3.2 5.9 2.3 virginica
144 145 6.7 3.3 5.7 2.5 virginica
145 146 6.7 3.0 5.2 2.3 virginica
146 147 6.3 2.5 5.0 1.9 virginica
147 148 6.5 3.0 5.2 2.0 virginica
148 149 6.2 3.4 5.4 2.3 virginica
149 150 5.9 3.0 5.1 1.8 virginica

挑战任务(可选)在这份数据中我们看到了序号和鸢尾花的各指标数据,通过两个python的功能组合产生如下数据结构:
{'setosa': 1, 'versicolor': 2, 'virginica': 3}和{'setosa': 'r', 'versicolor': 'b', 'virginica': 'g'}

In [3]:
iris_label = iris.Species.unique() iris_label 
Out[3]:
array(['setosa', 'versicolor', 'virginica'], dtype=object)
In [4]:
list(range(3)) 
Out[4]:
[0, 1, 2]
In [5]:
dict(zip(iris.Species.unique(),list(range(1,4)))) 
Out[5]:
{'setosa': 1, 'versicolor': 2, 'virginica': 3}
In [6]:
name_label = dict(zip(iris.Species.unique(),['r','g','b'])) name_label 
Out[6]:
{'setosa': 'r', 'versicolor': 'g', 'virginica': 'b'}

任务提示:查看数据结构大小

In [7]:
iris.shape 
Out[7]:
(150, 6)
In [8]:
iris.info() 
<class 'pandas.core.frame.DataFrame'>RangeIndex: 150 entries, 0 to 149Data columns (total 6 columns): #   Column        Non-Null Count  Dtype  ---  ------        --------------  -----   0   Unnamed: 0    150 non-null    int64   1   Sepal.Length  150 non-null    float64 2   Sepal.Width   150 non-null    float64 3   Petal.Length  150 non-null    float64 4   Petal.Width   150 non-null    float64 5   Species       150 non-null    object dtypes: float64(4), int64(1), object(1)memory usage: 7.2+ KB
In [9]:
iris.info 
Out[9]:
<bound method DataFrame.info of      Unnamed: 0  Sepal.Length  Sepal.Width  Petal.Length  Petal.Width  \0             1           5.1          3.5           1.4          0.2   1             2           4.9          3.0           1.4          0.2   2             3           4.7          3.2           1.3          0.2   3             4           4.6          3.1           1.5          0.2   4             5           5.0          3.6           1.4          0.2   ..          ...           ...          ...           ...          ...   145         146           6.7          3.0           5.2          2.3   146         147           6.3          2.5           5.0          1.9   147         148           6.5          3.0           5.2          2.0   148         149           6.2          3.4           5.4          2.3   149         150           5.9          3.0           5.1          1.8          Species  0       setosa  1       setosa  2       setosa  3       setosa  4       setosa  ..         ...  145  virginica  146  virginica  147  virginica  148  virginica  149  virginica  [150 rows x 6 columns]>
In [10]:
print(iris.groupby('Species').size()) 
Speciessetosa        50versicolor    50virginica     50dtype: int64

还可以输入200个字

蝈蝈派【海南省教改项目(Hnjg2022-80)支持】 网站版权所有

Python remained the copyright of our website

吉公网安备 22020402000437号

备案号:吉ICP备2020005062号-2

关注QQ群

了解Python

实时动态