目次 [開く]
元データ作成ミス_段取修正
現状の問題と修正計画(学習計画の変更)
現状の問題点
問題 1: データが統一されていなかった
- RNN・CNN + LSTM の データ分割・前処理が統一されていなかったため、正確な比較ができない
- モデルの違いによる精度の差なのか、データの違いによる影響なのかが不明確
- これでは、今後の Transformer などの学習結果とも比較できない
問題 2: モデルの評価基準(指標)が統一されていなかった
- 学習の評価を行う際の Accuracy, Precision, Recall, F1-score の統一ルールがなかった
- Confusion Matrix の分析も不十分だった
- どの指標を重視すべきか?を事前に定めていなかった
問題 3: ハイパーパラメータの統一ルールがなかった
- CNN + LSTM の 層の数、LSTM のユニット数、学習率 などの設定が 他のモデルと統一されていなかった
- どのパラメータが精度にどのような影響を与えているのかが分析できなかった
学習計画の変更内容
これらの問題を 最低限の修正で解決する方針 に変更する。
修正項目 | 変更内容 | 目的 |
---|---|---|
02_data_splitting.ipynb を修正し、全モデルで統一したデータを使用 | モデル比較を正しく行うため | |
RNN はそのまま活用し、影響の大きい CNN + LSTM のみ再学習 | 時間を最小限に抑えつつ、比較できる状態にするため | |
Accuracy, Precision, Recall, F1-score, Confusion Matrix を全モデルで適用 | 公平な比較を行うため | |
LSTM のユニット数, 学習率, ドロップアウト率などのパラメータの比較基準を定める | 学習結果のバラつきをなくすため |
修正後の具体的な段取り
今後の流れは以下のように進める。
ステップ | 作業内容 | 目的 |
---|---|---|
Step 1 | 02_data_splitting.ipynb を修正し、統一データセットを作成 | モデル比較を正しく行うため |
Step 2 | 統一データを適用し、CNN + LSTM のみ再学習 | 時間を最小限に抑え、影響の大きい部分だけ修正 |
Step 3 | RNN・CNN + LSTM の評価指標を統一し、比較を実施 | 比較可能なデータを作成する |
Step 4 | その後、次のステップ(Transformer など)へ進む | モデルの改善を継続する |
次にやるべきこと
02_data_splitting.ipynb
の修正を開始!
- 統一されたデータを作り、全モデルが同じデータを使えるようにする。
- このデータを基に CNN + LSTM を再学習し、正しい比較ができるようにする。
結論
「すべてをやり直すのではなく、最低限の修正で学習を正しい状態にする」
「データ統一 → CNN + LSTM 再学習 → モデル比較 → 次の学習へ進む」
「まずは
データセットの分割
の修正から開始!」