Numpy能从磁盘直接存储和加载数据,不论是文本格式还是二进制模式。这里我们只考虑Numpy的二进制模式,因为大多数用户更喜欢用pandas或其他工具来加载text或tabular数据。
np.save和np.load。数组会以未压缩的原始二进制模式被保存,后缀为.npy:
import numpy as np
arr = np.arange(10)
np.save('../examples/some_array', arr)
即使保存的时候没有加后缀,也会被自动加上。可以用np.load来加载数组:
np.load('../examples/some_array.npy')
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
用np.savez能保存多个数组,还可以指定数组对应的关键字,不过是未压缩的npz格式:
np.savez('../examples/array_archive.npz', a=arr, b=arr)
加载.npz文件的时候,得到一个dict object:
arch = np.load('../examples/array_archive.npz')
arch['b']
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
可以用np.savez_compressed来压缩文件:
np.savez_compressed('../examples/array_compressed.npz', a=arr, b=arr)