Notebook

Gridding PFT variables to sparse arrays¶

This notebook explores regridding the PFT variables as sparse arrays using the pydata/sparse package.

Inspired by PFT-Gridding.ipynb

Importing Libraries¶

In [1]:

%matplotlib inline

import numpy as np
import xarray as xr
from ctsm_py import utils

Defining simulation information¶

In [2]:

datadir = "/glade/p/cgd/tss/people/dll/TRENDY2019_History/"
sim = "S0_control/"
datadir = datadir + sim
simname = "TRENDY2019_S0_control_v2.clm2.h1."
var = "GPP"
years = "170001-201812"

maxval = "True"

In [3]:

print(datadir + simname + var + "." + years + ".nc")

/glade/p/cgd/tss/people/dll/TRENDY2019_History/S0_control/TRENDY2019_S0_control_v2.clm2.h1.GPP.170001-201812.nc

In [4]:

# This is an example copied from Dan's script -- helps to read in multiple variables
# dir =
# sim =
# pref = 'lnd/proc/tseries/month_1'
# suff = ".clm2.h0."
# variables = [" "]
# pattern   = dir + sim + proc + pref + '{var}' + suff
# files = [pattern.format(var=var) for var in variables]

# for multiple files, use xr.open_mfdataset; dan also uses utils.time_set_mid to make the time dims work properly

# 365*utils.weighted_annual_mean --> weights by days/month
# timeslice: ix_time = (ds['time.year']>1963) & (ds['time.year']<2014) # note that dan's dataset is 'ds'
# plt.subplot(121) #-->1 row, 2 plots, plot 1
# signal.detrend (?)

In [5]:

data1 = utils.time_set_mid(
    xr.open_dataset(
        datadir + simname + var + "." + years + ".nc",
        decode_times=True,
        chunks={"time": 100},
    ),
    "time",
)
data1

Out[5]:

<xarray.Dataset>
Dimensions:             (levgrnd: 25, levlak: 10, levdcmp: 25, lon: 288, lat: 192, gridcell: 21013, landunit: 48359, column: 111429, pft: 166408, time: 3828, hist_interval: 2)
Coordinates:
  * levgrnd             (levgrnd) float32 0.01 0.04 0.09 ... 19.48 28.87 42.0
  * levlak              (levlak) float32 0.05 0.6 2.1 4.6 ... 25.6 34.33 44.78
  * levdcmp             (levdcmp) float32 0.01 0.04 0.09 ... 19.48 28.87 42.0
  * lon                 (lon) float32 0.0 1.25 2.5 3.75 ... 356.2 357.5 358.8
  * lat                 (lat) float32 -90.0 -89.06 -88.12 ... 88.12 89.06 90.0
  * time                (time) object 1700-01-16 11:44:59.999993 ... 2018-12-...
Dimensions without coordinates: gridcell, landunit, column, pft, hist_interval
Data variables: (12/51)
    area                (lat, lon) float32 dask.array<chunksize=(192, 288), meta=np.ndarray>
    landfrac            (lat, lon) float32 dask.array<chunksize=(192, 288), meta=np.ndarray>
    landmask            (lat, lon) float64 dask.array<chunksize=(192, 288), meta=np.ndarray>
    pftmask             (lat, lon) float64 dask.array<chunksize=(192, 288), meta=np.ndarray>
    nbedrock            (lat, lon) float64 dask.array<chunksize=(192, 288), meta=np.ndarray>
    grid1d_lon          (gridcell) float64 dask.array<chunksize=(21013,), meta=np.ndarray>
    ...                  ...
    mscur               (time) float64 dask.array<chunksize=(100,), meta=np.ndarray>
    nstep               (time) float64 dask.array<chunksize=(100,), meta=np.ndarray>
    time_bounds         (time, hist_interval) object dask.array<chunksize=(100, 2), meta=np.ndarray>
    date_written        (time) object dask.array<chunksize=(100,), meta=np.ndarray>
    time_written        (time) object dask.array<chunksize=(100,), meta=np.ndarray>
    GPP                 (time, pft) float32 dask.array<chunksize=(100, 166408), meta=np.ndarray>
Attributes: (12/102)
    title:                                     CLM History file information
    comment:                                   NOTE: None of the variables ar...
    Conventions:                               CF-1.0
    history:                                   created on 09/27/19 16:25:57
    source:                                    Community Terrestrial Systems ...
    hostname:                                  cheyenne
    ...                                        ...
    cft_irrigated_tropical_corn:               62
    cft_tropical_soybean:                      63
    cft_irrigated_tropical_soybean:            64
    time_period_freq:                          month_1
    Time_constant_3Dvars_filename:             ./TRENDY2019_S0_constant_v2.cl...
    Time_constant_3Dvars:                      ZSOI:DZSOI:WATSAT:SUCSAT:BSW:H...

xarray.Dataset

Dimensions:
- levgrnd: 25
- levlak: 10
- levdcmp: 25
- lon: 288
- lat: 192
- gridcell: 21013
- landunit: 48359
- column: 111429
- pft: 166408
- time: 3828
- hist_interval: 2

Coordinates: (6)

Data variables: (51)

area

(lat, lon)

float32

dask.array<chunksize=(192, 288), meta=np.ndarray>

long_name :: grid cell areas
units :: km^2

	Array	Chunk
Bytes	221.18 kB	221.18 kB
Shape	(192, 288)	(192, 288)
Count	2 Tasks	1 Chunks
Type	float32	numpy.ndarray

landfrac

(lat, lon)

float32

dask.array<chunksize=(192, 288), meta=np.ndarray>

long_name :: land fraction

	Array	Chunk
Bytes	221.18 kB	221.18 kB
Shape	(192, 288)	(192, 288)
Count	2 Tasks	1 Chunks
Type	float32	numpy.ndarray

landmask

(lat, lon)

float64

dask.array<chunksize=(192, 288), meta=np.ndarray>

long_name :: land/ocean mask (0.=ocean and 1.=land)

	Array	Chunk
Bytes	442.37 kB	442.37 kB
Shape	(192, 288)	(192, 288)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

pftmask

(lat, lon)

float64

dask.array<chunksize=(192, 288), meta=np.ndarray>

long_name :: pft real/fake mask (0.=fake and 1.=real)

	Array	Chunk
Bytes	442.37 kB	442.37 kB
Shape	(192, 288)	(192, 288)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

nbedrock

(lat, lon)

float64

dask.array<chunksize=(192, 288), meta=np.ndarray>

long_name :: index of shallowest bedrock layer

	Array	Chunk
Bytes	442.37 kB	442.37 kB
Shape	(192, 288)	(192, 288)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

grid1d_lon

(gridcell)

float64

dask.array<chunksize=(21013,), meta=np.ndarray>

long_name :: gridcell longitude
units :: degrees_east

	Array	Chunk
Bytes	168.10 kB	168.10 kB
Shape	(21013,)	(21013,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

grid1d_lat

(gridcell)

float64

dask.array<chunksize=(21013,), meta=np.ndarray>

long_name :: gridcell latitude
units :: degrees_north

	Array	Chunk
Bytes	168.10 kB	168.10 kB
Shape	(21013,)	(21013,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

grid1d_ixy

(gridcell)

float64

dask.array<chunksize=(21013,), meta=np.ndarray>

long_name :: 2d longitude index of corresponding gridcell

	Array	Chunk
Bytes	168.10 kB	168.10 kB
Shape	(21013,)	(21013,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

grid1d_jxy

(gridcell)

float64

dask.array<chunksize=(21013,), meta=np.ndarray>

long_name :: 2d latitude index of corresponding gridcell

	Array	Chunk
Bytes	168.10 kB	168.10 kB
Shape	(21013,)	(21013,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

land1d_lon

(landunit)

float64

dask.array<chunksize=(48359,), meta=np.ndarray>

long_name :: landunit longitude
units :: degrees_east

	Array	Chunk
Bytes	386.87 kB	386.87 kB
Shape	(48359,)	(48359,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

land1d_lat

(landunit)

float64

dask.array<chunksize=(48359,), meta=np.ndarray>

long_name :: landunit latitude
units :: degrees_north

	Array	Chunk
Bytes	386.87 kB	386.87 kB
Shape	(48359,)	(48359,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

land1d_ixy

(landunit)

float64

dask.array<chunksize=(48359,), meta=np.ndarray>

long_name :: 2d longitude index of corresponding landunit

	Array	Chunk
Bytes	386.87 kB	386.87 kB
Shape	(48359,)	(48359,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

land1d_jxy

(landunit)

float64

dask.array<chunksize=(48359,), meta=np.ndarray>

long_name :: 2d latitude index of corresponding landunit

	Array	Chunk
Bytes	386.87 kB	386.87 kB
Shape	(48359,)	(48359,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

land1d_gi

(landunit)

float64

dask.array<chunksize=(48359,), meta=np.ndarray>

long_name :: 1d grid index of corresponding landunit

	Array	Chunk
Bytes	386.87 kB	386.87 kB
Shape	(48359,)	(48359,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

land1d_wtgcell

(landunit)

float64

dask.array<chunksize=(48359,), meta=np.ndarray>

long_name :: landunit weight relative to corresponding gridcell

	Array	Chunk
Bytes	386.87 kB	386.87 kB
Shape	(48359,)	(48359,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

land1d_ityplunit

(landunit)

float64

dask.array<chunksize=(48359,), meta=np.ndarray>

long_name :: landunit type (vegetated,urban,lake,wetland,glacier or glacier_mec)

	Array	Chunk
Bytes	386.87 kB	386.87 kB
Shape	(48359,)	(48359,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

land1d_active

(landunit)

float64

dask.array<chunksize=(48359,), meta=np.ndarray>

long_name :: true => do computations on this landunit
flag_values :: [0 1]
flag_meanings :: FALSE TRUE
valid_range :: [0 1]

	Array	Chunk
Bytes	386.87 kB	386.87 kB
Shape	(48359,)	(48359,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_lon

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: column longitude
units :: degrees_east

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_lat

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: column latitude
units :: degrees_north

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_ixy

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: 2d longitude index of corresponding column

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_jxy

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: 2d latitude index of corresponding column

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_gi

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: 1d grid index of corresponding column

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_li

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: 1d landunit index of corresponding column

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_wtgcell

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: column weight relative to corresponding gridcell

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_wtlunit

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: column weight relative to corresponding landunit

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_itype_col

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: column type (see global attributes)

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_itype_lunit

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: column landunit type (vegetated,urban,lake,wetland,glacier or glacier_mec)

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

cols1d_active

(column)

float64

dask.array<chunksize=(111429,), meta=np.ndarray>

long_name :: true => do computations on this column
flag_values :: [0 1]
flag_meanings :: FALSE TRUE
valid_range :: [0 1]

	Array	Chunk
Bytes	891.43 kB	891.43 kB
Shape	(111429,)	(111429,)
Count	2 Tasks	1 Chunks
Type	float64	numpy.ndarray

pfts1d_lon

(pft)

float64