Python数据科学常用库——Pandas

Python数据科学常用库——Pandas

一、数据格式Series

0x1 创建Series

0x2 Series操作

二、数据格式Dataframe

0x1 创建Dataframe

0x2 Dataframe操作

三、深入理解Series和Dataframe

data = {
'Country': ['China', 'India', 'Brazil'],
'Capital': ['Beijing', 'New Delhi', 'Brasilia'],
'Population': ['1432732201', '1303171635', '207847528']
}

通过Series创建DataFrame

df_new:

转置df_new.T

Series和DataFrame的关系

三、Dataframe的IO操作

通过df1 = pd.read_clipboard()和df1.to_clipboard()方法,可以将列表存入到Excel文件中。

0x1 CSV文件操作

0x2 JSON文件操作

0x3 HTML文件操作

0x4 转换为EXCEL

四、Dataframe的高阶操作

切片操作

Reindex

df1 = DataFrame(np.random.rand(25).reshape([5,5]), index=['A','B','D','E','F'], columns=['c1','c2','c3','c4','c5'])

df1.reindex(index=['A','B','C','D','E','F'],columns=['c1','c2','c3','c4','c5','c6'])

删除操作

五、Mapping和Replace