元データ作成ミス_段取修正

元データ作成ミス_段取修正

📌 現状の問題と修正計画(学習計画の変更)


📌 1️⃣ 現状の問題点

❌ 問題 1: データが統一されていなかった

  • RNN・CNN + LSTM の データ分割・前処理が統一されていなかったため、正確な比較ができない
  • モデルの違いによる精度の差なのか、データの違いによる影響なのかが不明確
  • これでは、今後の Transformer などの学習結果とも比較できない

❌ 問題 2: モデルの評価基準(指標)が統一されていなかった

  • 学習の評価を行う際の Accuracy, Precision, Recall, F1-score の統一ルールがなかった
  • Confusion Matrix の分析も不十分だった
  • どの指標を重視すべきか?を事前に定めていなかった

❌ 問題 3: ハイパーパラメータの統一ルールがなかった

  • CNN + LSTM の 層の数、LSTM のユニット数、学習率 などの設定が 他のモデルと統一されていなかった
  • どのパラメータが精度にどのような影響を与えているのかが分析できなかった

📌 2️⃣ 学習計画の変更内容

これらの問題を 最低限の修正で解決する方針 に変更する。

修正項目変更内容目的
✅ データの統一02_data_splitting.ipynb を修正し、全モデルで統一したデータを使用モデル比較を正しく行うため
✅ CNN + LSTM のみ再学習RNN はそのまま活用し、影響の大きい CNN + LSTM のみ再学習時間を最小限に抑えつつ、比較できる状態にするため
✅ 評価指標の統一Accuracy, Precision, Recall, F1-score, Confusion Matrix を全モデルで適用公平な比較を行うため
✅ ハイパーパラメータの統一ルールを明確化LSTM のユニット数, 学習率, ドロップアウト率などのパラメータの比較基準を定める学習結果のバラつきをなくすため

📌 3️⃣ 修正後の具体的な段取り

今後の流れは以下のように進める。

ステップ作業内容目的
Step 102_data_splitting.ipynb を修正し、統一データセットを作成モデル比較を正しく行うため
Step 2統一データを適用し、CNN + LSTM のみ再学習時間を最小限に抑え、影響の大きい部分だけ修正
Step 3RNN・CNN + LSTM の評価指標を統一し、比較を実施比較可能なデータを作成する
Step 4その後、次のステップ(Transformer など)へ進むモデルの改善を継続する

📌 4️⃣ 次にやるべきこと

✅ 02_data_splitting.ipynb の修正を開始!

  • 統一されたデータを作り、全モデルが同じデータを使えるようにする。
  • このデータを基に CNN + LSTM を再学習し、正しい比較ができるようにする。

📢 結論

🔵 「すべてをやり直すのではなく、最低限の修正で学習を正しい状態にする」
🔵 「データ統一 → CNN + LSTM 再学習 → モデル比較 → 次の学習へ進む」
🔵 「まずは データセットの分割 の修正から開始!」