【3】数据分析--10--科学计算--Pandas--4--计算

一、算术运算法则

算术运算根据行列索引,补齐后运算,运算默认产生浮点数 补齐时缺项填充NaN (空值)

二维和一维、一维和零维间为广播运算 采用+ ‐ * /符号进行的二元运算产生新的对象

import pandas as pd
import numpy as np 

a= pd.DataFrame(np.arange(12).reshape(3,4))
print a
   0  1   2   3
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11

b = pd.DataFrame(np.arange(20).reshape(4,5))
print b
    0   1   2   3   4
0   0   1   2   3   4
1   5   6   7   8   9
2  10  11  12  13  14
3  15  16  17  18  19

print a+b
      0     1     2     3   4
0   0.0   2.0   4.0   6.0 NaN
1   9.0  11.0  13.0  15.0 NaN
2  18.0  20.0  22.0  24.0 NaN
3   NaN   NaN   NaN   NaN NaN

print a*b
      0     1      2      3   4
0   0.0   1.0    4.0    9.0 NaN
1  20.0  30.0   42.0   56.0 NaN
2  80.0  99.0  120.0  143.0 NaN
3   NaN   NaN    NaN    NaN NaN

数据类型的算术运算

方法 说明
.add(d, **argws) 类型间加法运算,可选参数
.sub(d, **argws) 类型间减法运算,可选参数
.mul(d, **argws) 类型间乘法运算,可选参数
.div(d, **argws) 类型间除法运算,可选参数

案例:

import pandas as pd
import numpy as np 

a= pd.DataFrame(np.arange(12).reshape(3,4))
print a
   0  1   2   3
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11

b = pd.DataFrame(np.arange(20).reshape(4,5))
print b
    0   1   2   3   4
0   0   1   2   3   4
1   5   6   7   8   9
2  10  11  12  13  14
3  15  16  17  18  19

e = b.add(a,fill_value=100)
print e
       0      1      2      3      4
0    0.0    2.0    4.0    6.0  104.0
1    9.0   11.0   13.0   15.0  109.0
2   18.0   20.0   22.0   24.0  114.0
3  115.0  116.0  117.0  118.0  119.0

f = a.mul(b,fill_value = 0)
print f
      0     1      2      3    4
0   0.0   1.0    4.0    9.0  0.0
1  20.0  30.0   42.0   56.0  0.0
2  80.0  99.0  120.0  143.0  0.0
3   0.0   0.0    0.0    0.0  0.0

案例:

import pandas as pd
import numpy as np 


b = pd.DataFrame(np.arange(20).reshape(4,5))
print b
    0   1   2   3   4
0   0   1   2   3   4
1   5   6   7   8   9
2  10  11  12  13  14
3  15  16  17  18  19

c =pd.Series(np.arange(4))
print c
0    0
1    1
2    2
3    3
dtype: int64

print c-10
0   -10
1    -9
2    -8
3    -7
dtype: int64

print b-c
      0     1     2     3   4
0   0.0   0.0   0.0   0.0 NaN
1   5.0   5.0   5.0   5.0 NaN
2  10.0  10.0  10.0  10.0 NaN
3  15.0  15.0  15.0  15.0 NaN

print b.sub(c,axis=0)
    0   1   2   3   4
0   0   1   2   3   4
1   4   5   6   7   8
2   8   9  10  11  12
3  12  13  14  15  16

不同维度间为广播运算,一维Series默认在轴1参与运算 使用运算方法可以令一维Series参与轴0运算

二、 比较运算法则

比较运算只能比较相同索引的元素,不进行补齐 二维和一维、一维和零维间为广播运算 采用> < >= <= == !=等符号进行的二元运算产生布尔对象

import pandas as pd
import numpy as np 


b = pd.DataFrame(np.arange(12).reshape(3,4))
d = pd.DataFrame(np.arange(12,0,-1).reshape(3,4))
c =pd.Series(np.arange(4))

print b
   0  1   2   3
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11

print d
    0   1   2  3
0  12  11  10  9
1   8   7   6  5
2   4   3   2  1

print a>d
       0      1      2      3
0  False  False  False  False
1  False  False  False   True
2   True   True   True   True

print a==d
       0      1      2      3
0  False  False  False  False
1  False  False   True  False
2  False  False  False  False

print a>c
       0      1      2      3
0  False  False  False  False
1   True   True   True   True
2   True   True   True   True

print c>0
0    False
1     True
2     True
3     True
dtype: bool

同维度运算,尺寸一致 不同维度,广播运算,默认在1轴

参考资料

北京理工大学 嵩山 www.python123.org

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学