done?

2025-10-12 00:55:07 -05:00
commit 250f763f1f
467 changed files with 19784 additions and 0 deletions
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/.hydra/config.yaml
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/.hydra/config.yaml
@@ -0,0 +1,33 @@
+seed: 42
+env_name: CartPole-v1
+train:
+  nstep: ${buffer.nstep}
+  timesteps: 50000
+  batch_size: 128
+  test_every: 2500
+  eps_max: 1
+  eps_min: 0.05
+  eps_steps: 12500
+  start_steps: 0
+  plot_interval: 2000
+  eval_interval: 2000
+  eval_episodes: 10
+agent:
+  gamma: 0.99
+  lr: 0.002
+  tau: 0.1
+  nstep: ${buffer.nstep}
+  target_update_interval: 3
+  hidden_size: 64
+  activation:
+    _target_: torch.nn.ELU
+  use_dueling: false
+  use_double: false
+buffer:
+  capacity: 50000
+  use_per: true
+  nstep: 1
+  gamma: ${agent.gamma}
+  per_alpha: 0.7
+  per_beta: 0.4
+  per_eps: 0.01
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/.hydra/hydra.yaml
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/.hydra/hydra.yaml
@@ -0,0 +1,155 @@
+hydra:
+  run:
+    dir: ./runs/${now:%Y-%m-%d}/${now:%H-%M-%S}_${hydra.job.override_dirname}
+  sweep:
+    dir: ./sweeps/${now:%Y-%m-%d}/${now:%H-%M-%S}_${hydra.job.override_dirname}
+    subdir: ${hydra.job.num}
+  launcher:
+    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
+  sweeper:
+    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
+    max_batch_size: null
+    params: null
+  help:
+    app_name: ${hydra.job.name}
+    header: '${hydra.help.app_name} is powered by Hydra.
+
+      '
+    footer: 'Powered by Hydra (https://hydra.cc)
+
+      Use --hydra-help to view Hydra specific help
+
+      '
+    template: '${hydra.help.header}
+
+      == Configuration groups ==
+
+      Compose your configuration from those groups (group=option)
+
+
+      $APP_CONFIG_GROUPS
+
+
+      == Config ==
+
+      Override anything in the config (foo.bar=value)
+
+
+      $CONFIG
+
+
+      ${hydra.help.footer}
+
+      '
+  hydra_help:
+    template: 'Hydra (${hydra.runtime.version})
+
+      See https://hydra.cc for more info.
+
+
+      == Flags ==
+
+      $FLAGS_HELP
+
+
+      == Configuration groups ==
+
+      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
+      to command line)
+
+
+      $HYDRA_CONFIG_GROUPS
+
+
+      Use ''--cfg hydra'' to Show the Hydra config.
+
+      '
+    hydra_help: ???
+  hydra_logging:
+    version: 1
+    formatters:
+      simple:
+        format: '[%(asctime)s][HYDRA] %(message)s'
+    handlers:
+      console:
+        class: logging.StreamHandler
+        formatter: simple
+        stream: ext://sys.stdout
+    root:
+      level: INFO
+      handlers:
+      - console
+    loggers:
+      logging_example:
+        level: DEBUG
+    disable_existing_loggers: false
+  job_logging:
+    version: 1
+    formatters:
+      simple:
+        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
+    handlers:
+      console:
+        class: logging.StreamHandler
+        formatter: simple
+        stream: ext://sys.stdout
+      file:
+        class: logging.FileHandler
+        formatter: simple
+        filename: ${hydra.runtime.output_dir}/${hydra.job.name}.log
+    root:
+      level: INFO
+      handlers:
+      - console
+      - file
+    disable_existing_loggers: false
+  env: {}
+  mode: RUN
+  searchpath: []
+  callbacks: {}
+  output_subdir: .hydra
+  overrides:
+    hydra:
+    - hydra.mode=RUN
+    task:
+    - buffer.use_per=true
+  job:
+    name: main
+    chdir: true
+    override_dirname: buffer.use_per=true
+    id: ???
+    num: ???
+    config_name: config
+    env_set: {}
+    env_copy: []
+    config:
+      override_dirname:
+        kv_sep: '='
+        item_sep: ','
+        exclude_keys: []
+  runtime:
+    version: 1.3.2
+    version_base: '1.3'
+    cwd: D:\Documents\Nextcloud\Documents\Project WUSTL\Academic\2025_Fall\CSE5100\Homeworks\hw2
+    config_sources:
+    - path: hydra.conf
+      schema: pkg
+      provider: hydra
+    - path: D:\Documents\Nextcloud\Documents\Project WUSTL\Academic\2025_Fall\CSE5100\Homeworks\hw2\hw2\cfgs
+      schema: file
+      provider: main
+    - path: ''
+      schema: structured
+      provider: schema
+    output_dir: D:\Documents\Nextcloud\Documents\Project WUSTL\Academic\2025_Fall\CSE5100\Homeworks\hw2\runs\2025-10-11\23-43-52_buffer.use_per=true
+    choices:
+      hydra/env: default
+      hydra/callbacks: null
+      hydra/job_logging: default
+      hydra/hydra_logging: default
+      hydra/hydra_help: default
+      hydra/help: default
+      hydra/sweeper: basic
+      hydra/launcher: basic
+      hydra/output: default
+  verbose: false
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/.hydra/overrides.yaml
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/.hydra/overrides.yaml
@@ -0,0 +1 @@
+- buffer.use_per=true
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/best_videos.mp4
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/best_videos.mp4
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/final_videos.mp4
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/final_videos.mp4
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/main.log
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/main.log
@@ -0,0 +1,28 @@
+[2025-10-11 23:43:53,676][__main__][INFO] - Training for 50000 timesteps with NormalQNetwork and PrioritizedReplayBuffer
+[2025-10-11 23:44:10,340][core][INFO] - Step: 2000, Eval mean: 167.4, Eval std: 44.43467114765226
+[2025-10-11 23:44:28,836][core][INFO] - Step: 4000, Eval mean: 193.3, Eval std: 37.97380676203006
+[2025-10-11 23:44:47,985][core][INFO] - Step: 6000, Eval mean: 100.3, Eval std: 2.7586228448267445
+[2025-10-11 23:45:07,025][core][INFO] - Step: 8000, Eval mean: 110.7, Eval std: 4.050925820105819
+[2025-10-11 23:45:26,143][core][INFO] - Step: 10000, Eval mean: 116.7, Eval std: 3.28785644455472
+[2025-10-11 23:45:45,589][core][INFO] - Step: 12000, Eval mean: 128.9, Eval std: 3.6999999999999997
+[2025-10-11 23:46:04,629][core][INFO] - Step: 14000, Eval mean: 102.4, Eval std: 2.4576411454889016
+[2025-10-11 23:46:24,888][core][INFO] - Step: 16000, Eval mean: 283.4, Eval std: 24.920674148184673
+[2025-10-11 23:46:46,747][core][INFO] - Step: 18000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:47:09,101][core][INFO] - Step: 20000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:47:30,699][core][INFO] - Step: 22000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:47:51,303][core][INFO] - Step: 24000, Eval mean: 142.5, Eval std: 4.5
+[2025-10-11 23:48:14,734][core][INFO] - Step: 26000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:48:37,095][core][INFO] - Step: 28000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:48:59,772][core][INFO] - Step: 30000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:49:20,254][core][INFO] - Step: 32000, Eval mean: 105.8, Eval std: 2.638181191654584
+[2025-10-11 23:49:41,804][core][INFO] - Step: 34000, Eval mean: 290.0, Eval std: 92.10971718553913
+[2025-10-11 23:50:05,661][core][INFO] - Step: 36000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:50:29,141][core][INFO] - Step: 38000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:50:50,699][core][INFO] - Step: 40000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:51:12,136][core][INFO] - Step: 42000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:51:33,089][core][INFO] - Step: 44000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:51:54,989][core][INFO] - Step: 46000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:52:18,438][core][INFO] - Step: 48000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:52:41,758][core][INFO] - Step: 50000, Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:53:06,483][core][INFO] - Final Eval mean: 500.0, Eval std: 0.0
+[2025-10-11 23:53:12,682][__main__][INFO] - Finish training with eval mean: 500.0
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/models/best_model.pt
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/models/best_model.pt
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/models/final_model.pt
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/models/final_model.pt
--- a/runs/2025-10-11/23-43-52_buffer.use_per=true/results.png
+++ b/runs/2025-10-11/23-43-52_buffer.use_per=true/results.png