Pandas学习笔记

Pandas数据结构

pandas的主要数据结构:Series和DataFarme

Series

  1. 一种类似一维数组的对象,由一组数据及相关的索引组成。

    #创建
    obj1 = Series([9,-1,7,6],index=['a','b','c','d'])
    obj1
    

    运行结果:

    a    9
    b   -1
    c    7
    d    6
    dtype: int64
    
  2. 通过字典的方式创建:

    data = {'a':1,'b':2,'c':3,'d':4}
    obj2 = Series(data)
    obj2
    

    运行结果:

    a    1
    b    2
    c    3
    d    4
    dtype: int64
    
  3. 通过列表形成创建:

    data = ['a','b','c','d']
    obj3 = Series(data)
    obj3
    

    运行结果:

    0    a
    1    b
    2    c
    3    d
    dtype: object
    
  4. 通过列表作为索引创建匹配,以indx值为索引去匹配查找data中的值,索引中未找到值的以NaN表示。data中多余的值不显示。

    data = {'a':1,'b':2,'c':3,'d':4}
    indx = ['a','c','d','e']
    obj4 = Series(data,index=indx)
    obj4
    

    运行结果:

    a    1.0
    c    3.0
    d    4.0
    e    NaN
    dtype: float64
    
  5. Series在运算中会自动对齐不同的索引的数据:

    obj2+ojb4
    

    运算结果:

    a    2.0
    b    NaN
    c    6.0
    d    8.0
    e    NaN
    dtype: float64
    
0%