Parameter Sweep

Populus trichocarpa


nano locator_NN_dropouts.slurm
# exit nano by holding Ctrl and pressing X; then save it by pushing Y

apptainer exec --cleanenv --bind /gscratch locator.sif \
    python /locator/scripts/locator.py \
    --matrix ${INPUTMATRIX} \
    --sample_data ${FILE} \
    --dropout_prop ${DROPOUT} \
    --out ${OUTDIR}dropout_sweep_${DROPOUT}_${FILEINDEX}

sbatch locator_NN_dropouts.slurm

# the following is an example result
sbatch: No account specified, defaulting to: account
Submitted batch job 12345678
# Slurm will assign a JobID when the job was submitted
# it will likely be an 8-digit number, but not 12345678

watch squeue -u UWNetID

ls -ltr log/

total 2944
-rw-r--r-- 1 UwNetID all 106480 Feb 22 16:34 locator_job_12345678.out
-rw-r--r-- 1 UwNetID all 102610 Feb 22 17:35 locator_array_12345678_4.out
-rw-r--r-- 1 UwNetID all 105432 Feb 22 17:35 locator_array_12345678_3.out
-rw-r--r-- 1 UwNetID all  88930 Feb 22 17:35 locator_array_12345678_1.out
-rw-r--r-- 1 UwNetID all 148436 Feb 22 17:35 locator_array_12345678_0.out
-rw-r--r-- 1 UwNetID all 151298 Feb 22 17:36 locator_array_12345678_2.out
-rw-r--r-- 1 UwNetID all  96132 Feb 23 12:10 dropout_sweep_12345678_9.out
-rw-r--r-- 1 UwNetID all  88070 Feb 23 12:10 dropout_sweep_12345678_6.out
-rw-r--r-- 1 UwNetID all  93373 Feb 23 12:10 dropout_sweep_12345678_8.out
-rw-r--r-- 1 UwNetID all 116711 Feb 23 12:10 dropout_sweep_12345678_10.out
-rw-r--r-- 1 UwNetID all 100077 Feb 23 12:10 dropout_sweep_12345678_5.out
-rw-r--r-- 1 UwNetID all 106358 Feb 23 12:10 dropout_sweep_12345678_4.out
-rw-r--r-- 1 UwNetID all 107491 Feb 23 12:10 dropout_sweep_12345678_1.out
-rw-r--r-- 1 UwNetID all 112362 Feb 23 12:10 dropout_sweep_12345678_2.out
-rw-r--r-- 1 UwNetID all 116769 Feb 23 12:10 dropout_sweep_12345678_3.out
-rw-r--r-- 1 UwNetID all 127419 Feb 23 12:10 dropout_sweep_12345678_13.out
-rw-r--r-- 1 UwNetID all 127367 Feb 23 12:10 dropout_sweep_12345678_14.out
-rw-r--r-- 1 UwNetID all  83225 Feb 23 12:10 dropout_sweep_12345678_0.out
-rw-r--r-- 1 UwNetID all 127283 Feb 23 12:10 dropout_sweep_12345678_7.out
-rw-r--r-- 1 UwNetID all 100342 Feb 23 12:10 dropout_sweep_12345678_12.out
-rw-r--r-- 1 UwNetID all 130560 Feb 23 12:10 dropout_sweep_12345678_11.out

head -3 log/dropout_sweep_12345678_0.out

The file index for this array job is: 0
The test set being used for this array job is: data/potr_m_pred0.txt
The dropout proportion being tested during this job is: 0.25

echo "The file index for this array job is:" $FILEINDEX
echo "The test set being used for this array job is:" $FILE
echo "The dropout proportion being tested during this job is:" $DROPOUT

Variable	Purpose	How It Works
`FILE_LIST`	Stores the list of test set files	Uses `ls -1 data/potr_m_pred*` to list files matching the pattern
`FILEINDEX`	Determines which test set file to use for each job	`FILEINDEX=$((${SLURM_ARRAY_TASK_ID}/3))` ensures each test set is used 3 times
`FILE`	The specific test set file for the current job	`FILE=${FILE_LIST[${FILEINDEX}]}` selects from `FILE_LIST` using `FILEINDEX`
`INPUTMATRIX`	Stores the genotype matrix file path	`INPUTMATRIX=($(echo data/potr_genotypes1000.txt))`

Variable	Purpose	How It Works
`DROPOUTS`	Stores the list of dropout values (0.25, 0.5, 0.75)	`DROPOUTS=(0.25 0.5 0.75)` defines the possible values
`DROPOUT`	Determines the dropout value for the current job	`DROPOUT=${DROPOUTS[${SLURM_ARRAY_TASK_ID}%3]}` cycles through the list

Variable	Purpose	How It Works
`OUTDIR`	Stores the output directory path	`OUTDIR=($(echo out/))` generalizes output path
Output file format	Ensures unique results file names different dropout values and test sets	`${OUTDIR}dropout_sweep_${DROPOUT}_${FILEINDEX}` includes dropout rate and test set index

SLURM_ARRAY_TASK_ID	FILEINDEX	FILE	DROPOUT	Output File Name	Log File Name
0	0	`data/potr_m_pred_0.txt`	0.25	`out/dropout_sweep_0.25_0`	`log/dropout_sweep_<jobID>_0.out`
1	0	`data/potr_m_pred_0.txt`	0.5	`out/dropout_sweep_0.5_0`	`log/dropout_sweep_<jobID>_1.out`
2	0	`data/potr_m_pred_0.txt`	0.75	`out/dropout_sweep_0.75_0`	`log/dropout_sweep_<jobID>_2.out`
3	1	`data/potr_m_pred_1.txt`	0.25	`out/dropout_sweep_0.25_1`	`log/dropout_sweep_<jobID>_3.out`
4	1	`data/potr_m_pred_1.txt`	0.5	`out/dropout_sweep_0.5_1`	`log/dropout_sweep_<jobID>_4.out`
5	1	`data/potr_m_pred_1.txt`	0.75	`out/dropout_sweep_0.75_1`	`log/dropout_sweep_<jobID>_5.out`
6	2	`data/potr_m_pred_2.txt`	0.25	`out/dropout_sweep_0.25_2`	`log/dropout_sweep_<jobID>_6.out`
7	2	`data/potr_m_pred_2.txt`	0.5	`out/dropout_sweep_0.5_2`	`log/dropout_sweep_<jobID>_7.out`
8	2	`data/potr_m_pred_2.txt`	0.75	`out/dropout_sweep_0.75_2`	`log/dropout_sweep_<jobID>_8.out`
9	3	`data/potr_m_pred_3.txt`	0.25	`out/dropout_sweep_0.25_3`	`log/dropout_sweep_<jobID>_9.out`
10	3	`data/potr_m_pred_3.txt`	0.5	`out/dropout_sweep_0.5_3`	`log/dropout_sweep_<jobID>_10.out`
11	3	`data/potr_m_pred_3.txt`	0.75	`out/dropout_sweep_0.75_3`	`log/dropout_sweep_<jobID>_11.out`
12	4	`data/potr_m_pred_4.txt`	0.25	`out/dropout_sweep_0.25_4`	`log/dropout_sweep_<jobID>_12.out`
13	4	`data/potr_m_pred_4.txt`	0.5	`out/dropout_sweep_0.5_4`	`log/dropout_sweep_<jobID>_13.out`
14	4	`data/potr_m_pred_4.txt`	0.75	`out/dropout_sweep_0.75_4`	`log/dropout_sweep_<jobID>_14.out`

Parameter Sweep

Leveling up your Slurm usage with scripting

Why use scripting for Slurm?

New Features in `locator_NN_dropouts.slurm`

Variables

1. Input Variables

2. Dropout Handling

3. Output Variables

Command Breakdown

Job array variable values

Submit the script

Leveling up your Slurm usage with scripting​

Why use scripting for Slurm?​

New Features in locator_NN_dropouts.slurm​

Variables​

1. Input Variables​

2. Dropout Handling​

3. Output Variables​

Command Breakdown​

Job array variable values​

Submit the script​

Leveling up your Slurm usage with scripting

Why use scripting for Slurm?

New Features in `locator_NN_dropouts.slurm`

Variables

1. Input Variables

2. Dropout Handling

3. Output Variables

Command Breakdown

Job array variable values

Submit the script