From e7479e27d2fa56e4bd07ecbf6b00ee3b8433e679 Mon Sep 17 00:00:00 2001
From: budzianowski <budzianowski@gmail.com>
Date: Mon, 18 Nov 2024 16:41:24 -0800
Subject: [PATCH 1/3] update logging

---
 sim/h5_logger.py        |  2 +-
 sim/produce_sim_data.py |  2 +-
 sim/sim2sim.py          | 28 +++++++++++++++++++++++-----
 3 files changed, 25 insertions(+), 7 deletions(-)

diff --git a/sim/h5_logger.py b/sim/h5_logger.py
index 6f7424b..3365492 100644
--- a/sim/h5_logger.py
+++ b/sim/h5_logger.py
@@ -123,4 +123,4 @@ def _plot_dataset(name: str, data: np.ndarray):
 
 
 if __name__ == "__main__":
-    HDF5Logger.visualize_h5("stompypro/6dc85e02-fc8e-42e1-a396-b0bd578e0816.h5")
+    HDF5Logger.visualize_h5("stompypro/1d0b1829-535a-441b-a568-588b7e700d91.h5")
diff --git a/sim/produce_sim_data.py b/sim/produce_sim_data.py
index cb513e9..85e1f85 100644
--- a/sim/produce_sim_data.py
+++ b/sim/produce_sim_data.py
@@ -1,4 +1,4 @@
-"""Produce simulation data for training."""
+""" Produce simulation data for training."""
 import argparse
 import multiprocessing as mp
 import subprocess
diff --git a/sim/sim2sim.py b/sim/sim2sim.py
index d8f988b..55a9292 100755
--- a/sim/sim2sim.py
+++ b/sim/sim2sim.py
@@ -7,12 +7,10 @@
 import argparse
 import math
 import os
-import uuid
 from copy import deepcopy
 from dataclasses import dataclass
 from typing import Dict, List, Tuple, Union
 
-import h5py
 import mujoco
 import mujoco_viewer
 import numpy as np
@@ -31,6 +29,8 @@ class Sim2simCfg:
     dt: float = 0.001
     decimation: int = 10
     tau_factor: float = 3
+    cycle_time: float = 0.4
+
 
 
 def handle_keyboard_input() -> None:
@@ -238,7 +238,13 @@ def run_mujoco(
             if args.log_h5:
                 logger.log_data({
                     "t": np.array([count_lowlevel * cfg.dt], dtype=np.float32),
-                    "2D_command": np.array([x_vel_cmd, y_vel_cmd], dtype=np.float32),
+                    "2D_command": np.array(
+                        [
+                            np.sin(2 * math.pi * count_lowlevel * cfg.dt / cfg.cycle_time),
+                            np.cos(2 * math.pi * count_lowlevel * cfg.dt / cfg.cycle_time),
+                        ],
+                        dtype=np.float32,
+                    ),
                     "3D_command": np.array([x_vel_cmd, y_vel_cmd, yaw_vel_cmd], dtype=np.float32),
                     "joint_pos": cur_pos_obs.astype(np.float32),
                     "joint_vel": cur_vel_obs.astype(np.float32),
@@ -326,6 +332,7 @@ def parse_modelmeta(
             dt=0.001,
             decimation=10,
             tau_factor=4.0,
+            cycle_time=policy_cfg.cycle_time,
         )
     elif args.embodiment == "stompymicro":
         policy_cfg.cycle_time = 0.2
@@ -334,16 +341,27 @@ def parse_modelmeta(
             dt=0.001,
             decimation=10,
             tau_factor=2,
+            cycle_time=policy_cfg.cycle_time,
         )
 
     if args.load_model.endswith(".onnx"):
         policy = ort.InferenceSession(args.load_model)
     else:
-        policy = convert_model_to_onnx(args.load_model, policy_cfg, save_path="policy.onnx")
+        policy = convert_model_to_onnx(
+            args.load_model, policy_cfg, save_path="policy.onnx"
+        )
 
     model_info = parse_modelmeta(
         policy.get_modelmeta().custom_metadata_map.items(),
         verbose=True,
     )
 
-    run_mujoco(args.embodiment, policy, cfg, model_info, args.keyboard_use, args.log_h5, args.render)
+    run_mujoco(
+        args.embodiment,
+        policy,
+        cfg,
+        model_info,
+        args.keyboard_use,
+        args.log_h5,
+        args.render,
+    )

From 643bcabcdac02cb0f71d861ab4dcde1d4cd5f73b Mon Sep 17 00:00:00 2001
From: budzianowski <budzianowski@gmail.com>
Date: Tue, 19 Nov 2024 10:13:53 -0800
Subject: [PATCH 2/3] save previous action

---
 sim/produce_sim_data.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/sim/produce_sim_data.py b/sim/produce_sim_data.py
index 85e1f85..69f7e19 100644
--- a/sim/produce_sim_data.py
+++ b/sim/produce_sim_data.py
@@ -47,7 +47,7 @@ def run_parallel_sims(num_threads: int, args: argparse.Namespace) -> None:
     parser.add_argument("--num_threads", type=int, default=10, help="Number of parallel simulations to run")
     parser.add_argument("--embodiment", default="stompypro", type=str, help="Embodiment name")
     parser.add_argument("--load_model", default="examples/walking_pro.onnx", type=str, help="Path to model to load")
-    parser.add_argument("--num_examples", default=1000, type=int, help="Number of examples to run")
+    parser.add_argument("--num_examples", default=10000, type=int, help="Number of examples to run")
     args = parser.parse_args()
 
     # Run 100 examples total, in parallel batches

From 6b2338b9154673d9facc0056100ba9bdaeb81cf3 Mon Sep 17 00:00:00 2001
From: budzianowski <budzianowski@gmail.com>
Date: Tue, 19 Nov 2024 10:20:28 -0800
Subject: [PATCH 3/3] rename actions to comply

---
 sim/h5_logger.py | 6 +++---
 sim/sim2sim.py   | 9 ++++-----
 2 files changed, 7 insertions(+), 8 deletions(-)

diff --git a/sim/h5_logger.py b/sim/h5_logger.py
index 3365492..a1812fe 100644
--- a/sim/h5_logger.py
+++ b/sim/h5_logger.py
@@ -24,7 +24,7 @@ def _create_h5_file(self):
         h5_file = h5py.File(f"{self.data_name}/{idd}.h5", "w")
 
         # Create datasets for logging actions and observations
-        dset_actions = h5_file.create_dataset("actions", (self.max_timesteps, self.num_actions), dtype=np.float32)
+        dset_actions = h5_file.create_dataset("prev_actions", (self.max_timesteps, self.num_actions), dtype=np.float32)
         dset_2D_command = h5_file.create_dataset("observations/2D_command", (self.max_timesteps, 2), dtype=np.float32)
         dset_3D_command = h5_file.create_dataset("observations/3D_command", (self.max_timesteps, 3), dtype=np.float32)
         dset_q = h5_file.create_dataset("observations/q", (self.max_timesteps, self.num_actions), dtype=np.float32)
@@ -36,7 +36,7 @@ def _create_h5_file(self):
 
         # Map datasets for easy access
         h5_dict = {
-            "actions": dset_actions,
+            "prev_actions": dset_actions,
             "2D_command": dset_2D_command,
             "3D_command": dset_3D_command,
             "joint_pos": dset_q,
@@ -123,4 +123,4 @@ def _plot_dataset(name: str, data: np.ndarray):
 
 
 if __name__ == "__main__":
-    HDF5Logger.visualize_h5("stompypro/1d0b1829-535a-441b-a568-588b7e700d91.h5")
+    HDF5Logger.visualize_h5("stompypro/5a7dc371-445c-4f56-be05-4e65c5cc38bc.h5")
diff --git a/sim/sim2sim.py b/sim/sim2sim.py
index 55a9292..9945067 100755
--- a/sim/sim2sim.py
+++ b/sim/sim2sim.py
@@ -185,7 +185,6 @@ def run_mujoco(
     total_speed = 0.0
     step_count = 0
 
-    t = 0
     for _ in tqdm(range(int(cfg.sim_duration / cfg.dt)), desc="Simulating..."):
         if keyboard_use:
             handle_keyboard_input()
@@ -232,9 +231,6 @@ def run_mujoco(
 
             input_data["buffer.1"] = hist_obs.astype(np.float32)
 
-            positions, actions, hist_obs = policy.run(None, input_data)
-            target_q = positions
-
             if args.log_h5:
                 logger.log_data({
                     "t": np.array([count_lowlevel * cfg.dt], dtype=np.float32),
@@ -248,12 +244,15 @@ def run_mujoco(
                     "3D_command": np.array([x_vel_cmd, y_vel_cmd, yaw_vel_cmd], dtype=np.float32),
                     "joint_pos": cur_pos_obs.astype(np.float32),
                     "joint_vel": cur_vel_obs.astype(np.float32),
-                    "actions": actions.astype(np.float32),
+                    "prev_actions": actions.astype(np.float32),
                     "ang_vel": omega.astype(np.float32),
                     "euler_rotation": eu_ang.astype(np.float32),
                     "buffer": hist_obs.astype(np.float32)
                 })
 
+            positions, actions, hist_obs = policy.run(None, input_data)
+            target_q = positions
+
         # Generate PD control
         tau = pd_control(target_q, q, kps, dq, kds, default)  # Calc torques
         tau = np.clip(tau, -tau_limit, tau_limit)  # Clamp torques