..
|
__init__.py
|
common.py
|
ds_batch_config.json
|
gpt2-merges.txt
|
gpt2-vocab.json
|
megatron_model.py
|
modeling.py
|
modelingpreln.py
|
multi_output_model.py
|
simple_model.py
|
test_activation_checkpointing.py
|
test_adamw.py
|
test_aio.py
|
test_autocast.py
|
test_autotuning.py
|
test_bf16.py
|
test_checkpointing.py
|
test_coalesced_collectives.py
|
test_config.py
|
test_configurable_parallel.py
|
test_cpu_adagrad.py
|
test_cpu_adam.py
|
test_csr.py
|
test_cuda_backward.py
|
test_cuda_forward.py
|
test_curriculum_learning.py
|
test_data.py
|
test_dist.py
|
test_ds_arguments.py
|
test_ds_config.py
|
test_ds_initialize.py
|
test_dynamic_loss_scale.py
|
test_elastic.py
|
test_flops_profiler.py
|
test_fp16.py
|
test_ignore_unused_parameters.py
|
test_lr_schedulers.py
|
test_moe.py
|
test_multi_output_model.py
|
test_onebit.py
|
test_partition.py
|
test_pipe.py
|
test_pipe_module.py
|
test_pipe_schedule.py
|
test_pld.py
|
test_quantizer.py
|
test_run.py
|
test_runtime_utils.py
|
test_sparse_attention.py
|
test_sparse_grads.py
|
test_topology.py
|
test_zero.py
|
test_zero_context.py
|
test_zero_tiled.py
|
util.py
|