trial_index,submit_time,queue_time,start_time,end_time,run_time,program_string,VAL_ACC,exit_code,signal,hostname,OO_Info_SLURM_JOB_ID,arm_name,trial_status,generation_node,epochs,lr,batch_size,hidden_size,dropout,num_dense_layers,weight_decay,activation,init
0,1754313269,11,1754313280,1754313390,110,python3 .tests/mnist/train --epochs 54 --learning_rate 0.00769044743292033716 --batch_size 308 --hidden_size 111 --dropout 0.01018375158309936523 --activation leaky_relu --num_dense_layers 3 --init normal --weight_decay 0.79011875391006469727,,1,,c138,536848,0_0,FAILED,SOBOL,54,0.007690447432920337160477952665,308,111,0.010183751583099365234375,3,0.790118753910064697265625,leaky_relu,normal
1,1754313348,15,1754313363,1754313449,86,python3 .tests/mnist/train --epochs 124 --learning_rate 0.08697247240694240544 --batch_size 1076 --hidden_size 2034 --dropout 0.3411219082772731781 --activation leaky_relu --num_dense_layers 1 --init normal --weight_decay 0.49693113379180431366,,1,,c140,536853,1_0,RUNNING,SOBOL,124,0.086972472406942405442897836565,1076,2034,0.3411219082772731781005859375,1,0.49693113379180431365966796875,leaky_relu,normal
2,1754313389,18,1754313407,1754313432,25,python3 .tests/mnist/train --epochs 187 --learning_rate 0.04009552415218205212 --batch_size 804 --hidden_size 957 --dropout 0.43401775369420647621 --activation leaky_relu --num_dense_layers 2 --init normal --weight_decay 0.54891599714756011963,,1,,c138,536854,2_0,RUNNING,SOBOL,187,0.040095524152182052124437916518,804,957,0.434017753694206476211547851562,2,0.54891599714756011962890625,leaky_relu,normal
3,,,,,,,,,,,,3_0,RUNNING,SOBOL,69,0.067064965354362501837037768837,1541,1061,0.229788626078516244888305664062,4,0.226411486975848674774169921875,leaky_relu,normal
To cancel, press CTRL c, then run 'scancel 536841'
โ Importing logging...
โ Importing warnings...
โ Importing argparse...
โ Importing datetime...
โ Importing dataclass...
โ Importing hashlib...
โ Importing socket...
โ Importing stat...
โ Importing pwd...
โ Importing signal...
โ Importing base64...
โ Importing json...
โ Importing yaml...
โ Importing toml...
โ Importing csv...
โ Importing ast...
โ Importing rich.table...
โ Importing rich print...
โ Importing rich.pretty...
โ Importing rich.prompt...
โ Importing types.FunctionType...
โ Importing typing...
โ Importing ThreadPoolExecutor...
โ ผ Importing submitit.LocalExecutor...
โ Importing submitit.Job...
โ Importing importlib.util...
โ Importing inspect...
โ Importing platform...
โ Importing inspect frame info...
โ Importing pathlib.Path...
โ Importing uuid...
โ Importing traceback...
โ Importing cowsay...
โ Importing psutil...
โ Importing shutil...
โ Importing itertools.combinations...
โ Importing os.listdir...
โ Importing os.path...
โ Importing PIL.Image...
โ Importing sixel...
โ Importing subprocess...
โ Importing tqdm...
โ Importing beartype...
โ Importing statistics...
โ Trying to import pyfiglet...
โ Importing helpers...
โ Parsing arguments...
โ Importing torch...
โ Importing numpy...
โ Importing collections...
โ ผ Importing ax...
โ Importing ax.core.generator_run...
โ Importing Cont_X_trans and Y_trans from ax.modelbridge.registry...
โ Importing ax.core.arm...
โ Importing ax.core.objective...
โ Importing ax.core.Metric...
โ Importing ax.exceptions.core...
โ Importing ax.exceptions.generation_strategy...
โ Importing CORE_DECODER_REGISTRY...
โ Trying ax.generation_strategy.generation_node...
โ Importing GenerationStep, GenerationStrategy from generation_strategy...
โ Importing GenerationNode from generation_node...
โ Importing ExternalGenerationNode...
โ Importing MaxTrials...
โ Importing GeneratorSpec...
โ Importing Models from ax.modelbridge.registry...
โ Importing get_pending_observation_features...
โ Importing load_experiment...
โ Importing save_experiment...
โ Importing save_experiment_to_db...
โ Importing TrialStatus...
โ Importing Data...
โ Importing Experiment...
โ Importing parameter types...
โ Importing TParameterization...
โ Importing pandas...
โ Importing AxClient and ObjectiveProperties...
โ Importing RandomForestRegressor...
โ Importing botorch...
โ Importing submitit...
โ Importing ax logger...
โ Importing SQL-Storage-Stuff...
Run-UUID: 564505be-577b-4863-9e18-2c619d4246be
.oOOOo. .oOOOo.
.O o. o .O o. .oOOo.
O o O o O O
o O o O oOo o
O o `oOOoOO. 'OoOo. O O o .oOo. o O'
o O O o o o O o o O O o O O
`o O' o O O O o O `o O' o O o .O
`OoooO' O o o o O o' `OoooO' oOoO' `oO oOoOoO
O
o'
โ Writing worker creation log...
omniopt --partition=alpha --experiment_name=mnist_gpu_noall --mem_gb=10 --time=2880 --worker_timeout=120 --max_eval=500 --num_parallel_jobs=20 --gpus=1 --num_random_steps=20 --follow --live_share --send_anonymized_usage_stats --result_names VAL_ACC=max --run_program=cHl0aG9uMyAudGVzdHMvbW5pc3QvdHJhaW4gLS1lcG9jaHMgJWVwb2NocyAtLWxlYXJuaW5nX3JhdGUgJWxyIC0tYmF0Y2hfc2l6ZSAlYmF0Y2hfc2l6ZSAtLWhpZGRlbl9zaXplICVoaWRkZW5fc2l6ZSAtLWRyb3BvdXQgJWRyb3BvdXQgLS1hY3RpdmF0aW9uICVhY3RpdmF0aW9uIC0tbnVtX2RlbnNlX2xheWVycyAlbnVtX2RlbnNlX2xheWVycyAtLWluaXQgJWluaXQgLS13ZWlnaHRfZGVjYXkgJXdlaWdodF9kZWNheQ== --cpus_per_task=1 --nodes_per_job=1 --revert_to_random_when_seemingly_exhausted --model=BOTORCH_MODULAR --n_estimators_randomforest=100 --run_mode=local --occ_type=euclid --main_process_gb=8 --max_nr_of_zero_results=50 --slurm_signal_delay_s=0 --max_failed_jobs=0 --max_attempts_for_generation=20 --num_restarts=20 --raw_samples=1024 --max_abandoned_retrial=20 --max_num_of_parallel_sruns=16 --parameter epochs range 10 200 int false --parameter lr range 0.00001 0.1 float false --parameter batch_size range 8 2048 int false --parameter hidden_size range 8 2048 int false --parameter dropout range 0 0.5 float false --parameter activation fixed leaky_relu --parameter num_dense_layers range 1 4 int false --parameter init fixed normal --parameter weight_decay range 0 1 float false --ui_url aHR0cHM6Ly9pbWFnZXNlZy5zY2Fkcy5kZS9vbW5pYXgvZ3VpP3BhcnRpdGlvbj1hbHBoYSZleHBlcmltZW50X25hbWU9bW5pc3RfZ3B1X25vYWxsJnJlc2VydmF0aW9uPSZhY2NvdW50PSZtZW1fZ2I9MTAmdGltZT0yODgwJndvcmtlcl90aW1lb3V0PTEyMCZtYXhfZXZhbD01MDAmbnVtX3BhcmFsbGVsX2pvYnM9MjAmZ3B1cz0xJm51bV9yYW5kb21fc3RlcHM9MjAmZm9sbG93PTEmbGl2ZV9zaGFyZT0xJnNlbmRfYW5vbnltaXplZF91c2FnZV9zdGF0cz0xJmNvbnN0cmFpbnRzPSZyZXN1bHRfbmFtZXM9VkFMX0FDQyUzRG1heCZydW5fcHJvZ3JhbT1weXRob24zJTIwLnRlc3RzJTJGbW5pc3QlMkZ0cmFpbiUyMC0tZXBvY2hzJTIwJTI1ZXBvY2hzJTIwLS1sZWFybmluZ19yYXRlJTIwJTI1bHIlMjAtLWJhdGNoX3NpemUlMjAlMjViYXRjaF9zaXplJTIwLS1oaWRkZW5fc2l6ZSUyMCUyNWhpZGRlbl9zaXplJTIwLS1kcm9wb3V0JTIwJTI1ZHJvcG91dCUyMC0tYWN0aXZhdGlvbiUyMCUyNWFjdGl2YXRpb24lMjAtLW51bV9kZW5zZV9sYXllcnMlMjAlMjVudW1fZGVuc2VfbGF5ZXJzJTIwLS1pbml0JTIwJTI1aW5pdCUyMC0td2VpZ2h0X2RlY2F5JTIwJTI1d2VpZ2h0X2RlY2F5JnJ1bl9wcm9ncmFtX29uY2U9JmNwdXNfcGVyX3Rhc2s9MSZub2Rlc19wZXJfam9iPTEmc2VlZD0mZHJ5cnVuPTAmZGVidWc9MCZyZXZlcnRfdG9fcmFuZG9tX3doZW5fc2VlbWluZ2x5X2V4aGF1c3RlZD0xJmdyaWRzZWFyY2g9MCZtb2RlbD1CT1RPUkNIX01PRFVMQVImZXh0ZXJuYWxfZ2VuZXJhdG9yPSZuX2VzdGltYXRvcnNfcmFuZG9tZm9yZXN0PTEwMCZpbnN0YWxsYXRpb25fbWV0aG9kPWNsb25lJnJ1bl9tb2RlPWxvY2FsJmRpc2FibGVfdHFkbT0wJnZlcmJvc2VfdHFkbT0wJmZvcmNlX2xvY2FsX2V4ZWN1dGlvbj0wJmF1dG9fZXhjbHVkZV9kZWZlY3RpdmVfaG9zdHM9MCZzaG93X3NpeGVsX2dlbmVyYWw9MCZzaG93X3NpeGVsX3RyaWFsX2luZGV4X3Jlc3VsdD0wJnNob3dfc2l4ZWxfc2NhdHRlcj0wJnNob3dfd29ya2VyX3BlcmNlbnRhZ2VfdGFibGVfYXRfZW5kPTAmb2NjPTAmb2NjX3R5cGU9ZXVjbGlkJm5vX3NsZWVwPTAmc2x1cm1fdXNlX3NydW49MCZ2ZXJib3NlX2JyZWFrX3J1bl9zZWFyY2hfdGFibGU9MCZhYmJyZXZpYXRlX2pvYl9uYW1lcz0wJm1haW5fcHJvY2Vzc19nYj04Jm1heF9ucl9vZl96ZXJvX3Jlc3VsdHM9NTAmc2x1cm1fc2lnbmFsX2RlbGF5X3M9MCZtYXhfZmFpbGVkX2pvYnM9MCZleGNsdWRlPSZ1c2VybmFtZT0mZ2VuZXJhdGlvbl9zdHJhdGVneT0mcm9vdF92ZW52X2Rpcj0md29ya2Rpcj0mZG9udF9qaXRfY29tcGlsZT0wJmZpdF9vdXRfb2ZfZGVzaWduPTAmcmVmaXRfb25fY3Y9MCZzaG93X2dlbmVyYXRlX3RpbWVfdGFibGU9MCZkb250X3dhcm1fc3RhcnRfcmVmaXR0aW5nPTAmbWF4X2F0dGVtcHRzX2Zvcl9nZW5lcmF0aW9uPTIwJm51bV9yZXN0YXJ0cz0yMCZyYXdfc2FtcGxlcz0xMDI0Jm1heF9hYmFuZG9uZWRfcmV0cmlhbD0yMCZtYXhfbnVtX29mX3BhcmFsbGVsX3NydW5zPTE2JmZvcmNlX2Nob2ljZV9mb3JfcmFuZ2VzPTAmbm9fdHJhbnNmb3JtX2lucHV0cz0wJmZpdF9hYmFuZG9uZWQ9MCZub19ub3JtYWxpemVfeT0wJnZlcmJvc2U9MCZnZW5lcmF0ZV9hbGxfam9ic19hdF9vbmNlPTAmZmxhbWVfZ3JhcGg9MCZjaGVja291dF90b19sYXRlc3RfdGVzdGVkX3ZlcnNpb249MCZwYXJhbWV0ZXJfMF9uYW1lPWVwb2NocyZwYXJhbWV0ZXJfMF90eXBlPXJhbmdlJnBhcmFtZXRlcl8wX21pbj0xMCZwYXJhbWV0ZXJfMF9tYXg9MjAwJnBhcmFtZXRlcl8wX251bWJlcl90eXBlPWludCZwYXJhbWV0ZXJfMF9sb2dfc2NhbGU9ZmFsc2UmcGFyYW1ldGVyXzFfbmFtZT1sciZwYXJhbWV0ZXJfMV90eXBlPXJhbmdlJnBhcmFtZXRlcl8xX21pbj0wLjAwMDAxJnBhcmFtZXRlcl8xX21heD0wLjEmcGFyYW1ldGVyXzFfbnVtYmVyX3R5cGU9ZmxvYXQmcGFyYW1ldGVyXzFfbG9nX3NjYWxlPWZhbHNlJnBhcmFtZXRlcl8yX25hbWU9YmF0Y2hfc2l6ZSZwYXJhbWV0ZXJfMl90eXBlPXJhbmdlJnBhcmFtZXRlcl8yX21pbj04JnBhcmFtZXRlcl8yX21heD0yMDQ4JnBhcmFtZXRlcl8yX251bWJlcl90eXBlPWludCZwYXJhbWV0ZXJfMl9sb2dfc2NhbGU9ZmFsc2UmcGFyYW1ldGVyXzNfbmFtZT1oaWRkZW5fc2l6ZSZwYXJhbWV0ZXJfM190eXBlPXJhbmdlJnBhcmFtZXRlcl8zX21pbj04JnBhcmFtZXRlcl8zX21heD0yMDQ4JnBhcmFtZXRlcl8zX251bWJlcl90eXBlPWludCZwYXJhbWV0ZXJfM19sb2dfc2NhbGU9ZmFsc2UmcGFyYW1ldGVyXzRfbmFtZT1kcm9wb3V0JnBhcmFtZXRlcl80X3R5cGU9cmFuZ2UmcGFyYW1ldGVyXzRfbWluPTAmcGFyYW1ldGVyXzRfbWF4PTAuNSZwYXJhbWV0ZXJfNF9udW1iZXJfdHlwZT1mbG9hdCZwYXJhbWV0ZXJfNF9sb2dfc2NhbGU9ZmFsc2UmcGFyYW1ldGVyXzVfbmFtZT1hY3RpdmF0aW9uJnBhcmFtZXRlcl81X3R5cGU9Zml4ZWQmcGFyYW1ldGVyXzVfdmFsdWU9bGVha3lfcmVsdSZwYXJhbWV0ZXJfNl9uYW1lPW51bV9kZW5zZV9sYXllcnMmcGFyYW1ldGVyXzZfdHlwZT1yYW5nZSZwYXJhbWV0ZXJfNl9taW49MSZwYXJhbWV0ZXJfNl9tYXg9NCZwYXJhbWV0ZXJfNl9udW1iZXJfdHlwZT1pbnQmcGFyYW1ldGVyXzZfbG9nX3NjYWxlPWZhbHNlJnBhcmFtZXRlcl83X25hbWU9aW5pdCZwYXJhbWV0ZXJfN190eXBlPWZpeGVkJnBhcmFtZXRlcl83X3ZhbHVlPW5vcm1hbCZwYXJhbWV0ZXJfOF9uYW1lPXdlaWdodF9kZWNheSZwYXJhbWV0ZXJfOF90eXBlPXJhbmdlJnBhcmFtZXRlcl84X21pbj0wJnBhcmFtZXRlcl84X21heD0xJnBhcmFtZXRlcl84X251bWJlcl90eXBlPWZsb2F0JnBhcmFtZXRlcl84X2xvZ19zY2FsZT1mYWxzZSZwYXJ0aXRpb249YWxwaGEmbnVtX3BhcmFtZXRlcnM9OQ==
โ Disabling logging...
โ Setting run folder...
โ Creating folder /data/horse/ws/s3811141-oo_crap/OmniOpt/runs/mnist_gpu_noall/0...
โ Writing revert_to_random_when_seemingly_exhausted file ...
โ Writing username state file...
โ Writing result names file...
โ Writing result min/max file...
โ Saving state files...
Run-folder: /data/horse/ws/s3811141-oo_crap/OmniOpt/runs/mnist_gpu_noall/0
โ Printing run info...
โ Initializing NVIDIA-Logs...
โ Writing ui_url file if it is present...
โ Writing live_share file if it is present...
โ Writing job_start_time file...
โ ฆ Writing git info file...
โ Checking max_eval...
โ Calculating number of steps...
โ Adding excluded nodes...
โ Handling random steps...
โ Initializing ax_client...
[WARNING 08-04 15:12:26] ax.service.ax_client: Selecting a GenerationStrategy when using BatchTrials is in beta. Double check the recommended strategy matches your expectations.
โ Setting orchestrator...
You have 1 CPUs available for the main process. Using CUDA device NVIDIA H100. Generation strategy: SOBOL for 20 steps and then BOTORCH_MODULAR for 480 steps.
Run-Program: python3 .tests/mnist/train --epochs %epochs --learning_rate %lr --batch_size %batch_size --hidden_size %hidden_size --dropout %dropout --activation %activation --num_dense_layers %num_dense_layers --init %init --weight_decay %weight_decay
Experiment parameters
โโโโโโโโโโโโโโโโโโโโณโโโโโโโโณโโโโโโโโโโโโโโณโโโโโโโโโโโโโโณโโโโโโโโโโโโโณโโโโโโโโณโโโโโโโโโโโโโ
โ Name โ Type โ Lower bound โ Upper bound โ Values โ Type โ Log Scale? โ
โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ
โ epochs โ range โ 10 โ 200 โ โ int โ No โ
โ lr โ range โ 1e-05 โ 0.1 โ โ float โ No โ
โ batch_size โ range โ 8 โ 2048 โ โ int โ No โ
โ hidden_size โ range โ 8 โ 2048 โ โ int โ No โ
โ dropout โ range โ 0 โ 0.5 โ โ float โ No โ
โ activation โ fixed โ โ โ leaky_relu โ โ โ
โ num_dense_layers โ range โ 1 โ 4 โ โ int โ No โ
โ init โ fixed โ โ โ normal โ โ โ
โ weight_decay โ range โ 0 โ 1 โ โ float โ No โ
โโโโโโโโโโโโโโโโโโโโดโโโโโโโโดโโโโโโโโโโโโโโดโโโโโโโโโโโโโโดโโโโโโโโโโโโโดโโโโโโโโดโโโโโโโโโโโโโ
Result-Names
โโโโโโโโโโโโโโโณโโโโโโโโโโโโโโ
โ Result-Name โ Min or max? โ
โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ
โ VAL_ACC โ max โ
โโโโโโโโโโโโโโโดโโโโโโโโโโโโโโ
See https://imageseg.scads.de/omniax/share?user_id=s3811141&experiment_name=mnist_gpu_noall&run_nr=3 for live-results.
โโโโโโโย โย โย โโโโโย โโโโโโโโโโย ย โโโโโโโ
โย โโโย โย โโโย โโย โโโย โโโโโโโโโโย โย โโโย โ
โย โโโย โย โโย โโโโโโโโโโโโโโโโโโย โย โโโย โ
โโโโโโโย โโโโโย โโโย โโโโโโโย โโโย โโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโย โย โโโย
โย โโโโโโโย โย โโย โโย ย ย โโโโโย ย โโโโโโโโโโ
โโโโโย โโโโโย โโโย โโโโโโโโย โโย โโโโโโโโโ
โโโย โโโโย โโโโย โโโย ย โโโโย ย ย โโโโโโโโโโโ
โโโโโย โโย ย ย โโโโย โโโโโโโโโโโย โโโย โโโโโ
ย โโย โโโโโโโย โโโโโย ย ย โโโย โโย โโโโโโย โโโ
โโโโโโโโโย โย โโโโโโโโโโย โโโโย โโโโโโโโโ
ย โโโย โโย ย โย โโโโโโโโย โโโย โย โโโโโโย ย ย โโ
โโโโย โโย ย โโโโโโโโโโโโโโโโโโย โย โโโโโโโ
โย โโโย โโโย ย ย โโโโย ย โย โโโโย โโโโโย โโย ย โโ
โย ย โโย โโโย โย โโโโโโย โโย โโย โโโโโโโโโโย ย
โโโโโโโย โโโโโโย โโโโโย โย โโย โโโย โย โย ย โโ
โย โโโย โย โโย โโโโโโโย โโโโโย โโโโโโโโโโย โ
โย โโโย โย โโโโโย โโโย โย โโย ย ย โโโโโโโย ย โโโ
โโโโโโโย โย ย ย ย โย ย โย ย ย ย ย โย โโโย ย ย โโย โโโโ
Sobol, failed: 1 ('VAL_ACC: ' not found), completed 2โ2 (0%/20), getting new HP set : 0%|โโโโโโโโโโ| 0/500 [08:38, ?it/s]
Sobol, failed: 1 ('VAL_ACC: ' not found), completed 2โ2 (0%/20), requested 1 jobs, got 1, 291.08 s/job : 0%|โโโโโโโโโโ| 0/500 [09:36, ?it/s]
2025-08-04 15:12:51: SOBOL, Started OmniOpt2 run...
2025-08-04 15:13:25: Sobol, getting new HP set
2025-08-04 15:13:48: Sobol, requested 1 jobs, got 1, 23.28 s/job
2025-08-04 15:13:55: Sobol, eval #1/1 start
2025-08-04 15:14:11: Sobol, starting new job
2025-08-04 15:14:31: Sobol, unknown 1∑1 (5%/20), started new job
2025-08-04 15:14:48: Sobol, running 1∑1 (5%/20), getting new HP set
2025-08-04 15:15:22: Sobol, running 1∑1 (5%/20), requested 1 jobs, got 1, 34.50 s/job
2025-08-04 15:15:30: Sobol, running 1∑1 (5%/20), eval #1/1 start
2025-08-04 15:15:37: Sobol, running 1∑1 (5%/20), starting new job
2025-08-04 15:15:49: Sobol, running/unknown 1/1∑2 (10%/20), started new job
2025-08-04 15:15:55: Sobol, running/pending 1/1∑2 (10%/20), getting new HP set
2025-08-04 15:16:11: Sobol, running 2∑2 (10%/20), requested 1 jobs, got 1, 16.15 s/job
2025-08-04 15:16:17: Sobol, running 2∑2 (10%/20), eval #1/1 start
2025-08-04 15:16:24: Sobol, running 2∑2 (10%/20), starting new job
2025-08-04 15:16:30: Sobol, running/unknown 2/1∑3 (15%/20), started new job
2025-08-04 15:16:51: Sobol, completed/running 1/2∑3 (10%/20), job_failed
2025-08-04 15:17:11: Sobol, failed: 1 ('VAL_ACC: <FLOAT>' not found), running 2∑2 (10%/20), finishing jobs (_get_next_trials), finished 1 job
2025-08-04 15:21:30: Sobol, failed: 1 ('VAL_ACC: <FLOAT>' not found), completed 2∑2 (0%/20), getting new HP set
2025-08-04 15:22:28: Sobol, failed: 1 ('VAL_ACC: <FLOAT>' not found), completed 2∑2 (0%/20), requested 1 jobs, got 1, 291.08 s/job
timestamp,ram_usage_mb,cpu_usage_percent
1754313146,710.53125,11.1
1754313171,711.03125,7.2
1754313185,711.03125,7.5
1754313185,711.03125,8.5
1754313185,711.53125,7.1