針對這些 DataFrame(df、df_type0/1/2)進行 PyTorch LSTM 模型可用的標準化處理。
下面我會依據 LSTM 模型需求幫你設計這個流程,包括:
-
資料標準化(Zero-mean, Unit-std)
-
轉為 NumPy 陣列(每個 sample 為一筆時間序列的特徵向量)
-
可選:轉為 PyTorch Dataset
✅ Step 1:標準化全體 df(再套用到各類別)
✅ 假設每筆資料是獨立時間點(如 IMU frame)
✅ Step 2:對每個資料集標準化(df / df_type0 / df_type1 / df_type2)
✅ Step 3:轉成 NumPy 陣列(準備餵給 LSTM)
📌 LSTM 輸入格式為 (batch_size, seq_len, feature_dim)
如果每筆資料都是單點(沒有序列),你可以手動 reshape 加 seq_len=1
:
對於各類別:
✅ Step 4:轉為 PyTorch Dataset(LSTM 可用格式)
📦 DataLoader 建立(批次訓練)
✅ LSTM 輸入範例格式(模型)
🔍 小提醒:
-
如果你要處理 時間序列(多筆一組),需先將
DataFrame
按時間組成「序列視窗」,這邊是以每筆為單點(seq_len=1)做範例。 -
若你有 IMU 連續資料想轉為每 20 筆一個序列,也可用 sliding window 處理。
是否要我再補上「每 type 資料切成 seq_len=100 的滑動視窗」的處理邏輯?
這樣才真正符合 LSTM 使用場景。
沒有留言:
張貼留言