【3】数据分析-1-数据的处理--numpy--3--Numpy中stack(),vstack(), hstack()函数区别

一、 stack()函数

函数原型为:stack(arrays, axis=0),arrays可以传数组和列表。

import numpy as np
a=[[[1,2,3,4],[11,21,31,41]],
   [[5,6,7,8],[51,61,71,81]],
   [[9,10,11,12],[91,101,111,121]]]
print("列表a如下:")
print(a)

print("新维度的下标为0")
c=np.stack(a,axis=0)
print(c)

print("新维度的下标为1")
c=np.stack(a,axis=1)
print(c)

print("新维度的下标为2")
c=np.stack(a,axis=2)
print(c)

结果:

列表a如下:
[[[1, 2, 3, 4], [11, 21, 31, 41]], [[5, 6, 7, 8], [51, 61, 71, 81]], [[9, 10, 11, 12], [91, 101, 111, 121]]]
新维度的下标为0
[[[  1   2   3   4]
  [ 11  21  31  41]]

 [[  5   6   7   8]
  [ 51  61  71  81]]

 [[  9  10  11  12]
  [ 91 101 111 121]]]
新维度的下标为1
[[[  1   2   3   4]
  [  5   6   7   8]
  [  9  10  11  12]]

 [[ 11  21  31  41]
  [ 51  61  71  81]
  [ 91 101 111 121]]]
新维度的下标为2
[[[  1   5   9]
  [  2   6  10]
  [  3   7  11]
  [  4   8  12]]

 [[ 11  51  91]
  [ 21  61 101]
  [ 31  71 111]
  [ 41  81 121]]]

其中原数组a的shape为(3,2,4),即是一个三维数组。有3个维度。其中每个元素的都有一个索引。比如数字1的索引为[0,0,0],2的索引为[0,0,1],31的是[0,1,2],41的是[0,1,3],….5的是[1, 0,0], .8的是[1,0,3].9的索引是[2,0,0],等等。

其中,stack(a, axis=0),axis的值不能大于等于数组的维度。axis=0时,元素的索引值不变,仍是原来的索引,每个维度上的值不变,方向不变。

stack(a, axis=1), 个人理解,就是将数组中元素第0个维度的数值换到第1维度。如31就由[0,1,2]变为[1,0,2],41就由[0,1,3]变为[1,0,3], 8就由[1,0,3]变为[0,1,3],以此类推。所以数组的shape就变为了(2,3,4)

stack(a, axis=2) , 就是将数组中每个元素的第0个维度的索引值移到第2维度,原先的第1,第2维的索引值一起前移。如31就由[0,1,2]变为[1,2,0],41就由[0,1,3]变为[1,3,0],8就由[1,0,3]变为[0,3,1],以此类推。所以数组的shape就变为了(2,4,3)

2. hstack()函数

a = np.array([1,2,3])  
b = np.array([4,5,6])
c=[[[1,2,3,4],[11,21,31,41]],
   [[5,6,7,8],[51,61,71,81]],
   [[9,10,11,12],[91,101,111,121]]]
print('一维数组:')
print(np.hstack((a,b)))

a = np.array([[1],[2],[3]])
b = np.array([[4],[5],[6]])
print('二维数组:')
print(np.hstack((a,b)))

a = np.array([[[1],[11]],
              [[2],[21]],
              [[3],[31]]])

b = np.array([[[4],[41]],
              [[5],[51]],
              [[6],[61]]])
print('三维数组:')
print(np.hstack((a,b)))

print('三维数组2:')
print(np.hstack(c))

结果:

一维数组:
[1 2 3 4 5 6]
二维数组:
[[1 4]
 [2 5]
 [3 6]]
三维数组:
[[[ 1]
  [11]
  [ 4]
  [41]]

 [[ 2]
  [21]
  [ 5]
  [51]]

 [[ 3]
  [31]
  [ 6]
  [61]]]
三维数组2:
[[  1   2   3   4   5   6   7   8   9  10  11  12]
 [ 11  21  31  41  51  61  71  81  91 101 111 121]]

3. vstack()函数

a = np.array([1,2,3])  
b = np.array([4,5,6])
c=[[[1,2,3,4],[11,21,31,41]],
   [[5,6,7,8],[51,61,71,81]],
   [[9,10,11,12],[91,101,111,121]]]
print('一维数组:')
print(np.vstack((a,b)))

a = np.array([[1],[2],[3]])  
b = np.array([[4],[5],[6]])
print('二维数组:')
print(np.vstack((a,b)))

a = np.array([[[1],[11]],
              [[2],[21]],
              [[3],[31]]])

b = np.array([[[4],[41]],
              [[5],[51]],
              [[6],[61]]])
print('三维数组:')
print(np.vstack((a,b)))

print('三维数组2:')
print(np.vstack(c))

结果:

一维数组:
[[1 2 3]
 [4 5 6]]
二维数组:
[[1]
 [2]
 [3]
 [4]
 [5]
 [6]]
三维数组:
[[[ 1]
  [11]]

 [[ 2]
  [21]]

 [[ 3]
  [31]]

 [[ 4]
  [41]]

 [[ 5]
  [51]]

 [[ 6]
  [61]]]
三维数组2:
[[  1   2   3   4]
 [ 11  21  31  41]
 [  5   6   7   8]
 [ 51  61  71  81]
 [  9  10  11  12]
 [ 91 101 111 121]]

讨论

在网上搜了一下对这三个函数的解释,这个还算是比较靠谱的,但仍然有困惑,这个具体的应用场景在哪?怎么用肉眼一看,就知道怎么变形,同时vstack,hstack具体的意义何在呢??也许背后跟线性代数有关呢。。

参考资料

https://my.oschina.net/amui/blog/1601432

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn