Pandas数据结构
pandas的主要数据结构:Series和DataFarme
Series
一种类似一维数组的对象,由一组数据及相关的索引组成。
#创建 obj1 = Series([9,-1,7,6],index=['a','b','c','d']) obj1
运行结果:
a 9 b -1 c 7 d 6 dtype: int64
通过字典的方式创建:
data = {'a':1,'b':2,'c':3,'d':4} obj2 = Series(data) obj2
运行结果:
a 1 b 2 c 3 d 4 dtype: int64
通过列表形成创建:
data = ['a','b','c','d'] obj3 = Series(data) obj3
运行结果:
0 a 1 b 2 c 3 d dtype: object
通过列表作为索引创建匹配,以indx值为索引去匹配查找data中的值,索引中未找到值的以NaN表示。data中多余的值不显示。
data = {'a':1,'b':2,'c':3,'d':4} indx = ['a','c','d','e'] obj4 = Series(data,index=indx) obj4
运行结果:
a 1.0 c 3.0 d 4.0 e NaN dtype: float64
Series在运算中会自动对齐不同的索引的数据:
obj2+ojb4
运算结果:
a 2.0 b NaN c 6.0 d 8.0 e NaN dtype: float64