2025/02/10
3月頃に間に合わすよう2月から月末までをターゲットに予定を立ててみたが中々厳しいくなってきた。
最初からハンズオン形式を中心にやった方が良かったかと考えつつ、それでは行列ベクトルを理解せぬまま
ニューラルネットワークに挑むことになっていたので危なかった。微分から始める必要がないということも
知人からアドバイスされたが(学がある方の人)昔の事など覚えてないので学習し直してよかった。結局は
微分や線形回帰など再帰的な計算から近い結果を途方もないデータ量の中から正解らしきものに近づくには
その考え方が根底にないと前に進めなかった。やはり基礎部分の大枠な把握は必要のようだ。とはいいつつ
機械学習を学ぶにあたって、基礎、と呼ばれるものが多いので、幅広い知見が必要のようで、しょうがない。
時間はかかるが、初期に考えた段取りでコツコツ進めようと思う。GO言語は日数的に厳しそうだ。Udemy
講座を購入したが、それを無視して、基礎的構文が関の山かもしれない。
学習するのは、とても楽しいので、そこが今のモチベーションである。
仕事に良い形で繋げることが出来さえすれば、更に良い循環になるだろう。
早く何かしらのプロダクトを考えてUⅠ付きで作りたい。
ピンポイントなⅮX需要の課題に焦点を当てるのは良いかもしれない。
というところまで行けるまではまだ恐らく遠そうだ。学習していこう。。。
Week | 項目 | 内容 | 時間 (*学習中) | 学習形式 | 学習状況 |
---|---|---|---|---|---|
Week 1 | Pythonの基礎復習 | データ型、ループ、関数の基本操作 | *(0h) | 机上学習 | Python基礎 |
Jupyter Notebookの利用 | データ操作や可視化に使うツールの操作方法 | *(1h) *(1h) | 机上学習 ハンズオン | Jupyter Notebookとは Jupyter Notebookを利用する | |
Pandas/Numpy基礎 | データフレームの作成と操作、数値データの処理 | *(0h) *(0h) | ハンズオン | 未着手 | |
Kaggleアカウント作成と基本操作 | Kaggleの基本的な使い方 データセット取得 | *(2h) | 机上学習 | Kaggleアカウント作成 Kaggle基本操作 | |
特徴量抽出 | データからモデルに適した特徴量を選択する方法 | 机上学習 | 未着手 | ||
線形代数 線形モデル | 単回帰や重回帰の基礎 | *微分 *偏微分 *単回帰 *重回帰 | 机上学習 | スカラ・ベクトル・行列 線形回帰 微分/偏微分 単位行列と逆行列 単回帰分析 重回帰分析 | |
非線形代数 非線形モデル | 非線形手法の基礎と応用 | 活性化関数 活性化関数いろいろ | |||
勾配降下法 | ディープラーニングにおける最適化アルゴリズムの基礎 | (0h) | 机上学習 | 勾配降下法 勾配降下法いろいろ | |
Week 2 | ニューラルネットワークの基本構造 | 入力層、中間層、出力層 各層の役割 | (0h) | 机上学習 | ニューラルネットワーク1 ニューラルネットワーク2 ニューラルネットワーク3 |
活性化関数 | ReLU, Sigmoid, Softmax 違いと用途 | (0h) | 机上学習 | 活性化関数 活性化関数いろいろ | |
誤差逆伝播法 | ニューラルネットワーク 学習アルゴリズムの理解 | (0h) | 机上学習 | 誤差逆伝播法 | |
正則化 | ドロップアウト L1正則化、L2正則化の理解 | (0h) | 机上学習 | 未着手 | |
モデル評価:検証データ分割 | データセットの分割手法を学習 | (0h) | ハンズオン | 未着手 | |
モデル評価:混同行列 | 混同行列の構築と分析 | (0h) | ハンズオン | 未着手 | |
モデル評価:損失関数 | 損失関数の計算と適用 | (0h) | ハンズオン | 未着手 | |
Week 3 | 音声波形とスペクトログラムの理解 | 音声信号の周波数表現を学ぶ | (0h) | ハンズオン | 未着手 |
音声特徴量の抽出 | MFCCの理論と実装 | (0h) | ハンズオン | 未着手 | |
音声分類 | 話者認識や感情分類のためのモデル構築 | (0h) | ハンズオン | 未着手 | |
音声APIの利用 | 各クラウドの音声認識APIを比較・実装(AWS/Azure/Google Cloud) | (0h) | ハンズオン | 未着手 | |
Gitの操作 | コミット、ブランチ管理 | (0h) | ハンズオン | 未着手 | |
Docker構築 | Docker環境で音声処理アプリを実装 | (0h) | ハンズオン | 未着手 | |
Week 4 | 音声認識モデル | 音声→テキストの変換モデル構築 | (0h) | ハンズオン | 未着手 |
翻訳モデル | 英語→日本語翻訳モデル構築と評価 | (0h) | ハンズオン | 未着手 | |
シーケンス・ツー・シーケンスモデル | 多言語翻訳で使われる基本モデル | (0h) | 机上学習 | 未着手 | |
辞書追加とチューニング | 分野特化用語をモデルに反映する手法 | (0h) | ハンズオン | 未着手 | |
Week 5 | プロジェクト仕上げ | 最終成果物の完成とデプロイメント | (0h) | ハンズオン | 未着手 |
実務シミュレーション | 学んだ技術を用いた模擬プロジェクト | (0h) | ハンズオン | 未着手 | |
Pythonライブラリの実践 | TensorFlow/PyTorch, SpeechRecognition, librosaの実践 | (0h) | ハンズオン | 未着手 | |
振り返りと次のステップ | 学習の総まとめと次の学習計画 | (0h) | 机上学習 | 未着手 |
全体の学習計画と期間の見積もり
ステップ | 主な作業内容 |
---|---|
① APIや事前学習済みモデルで「音声→翻訳」までを一通り動かす | API (Azure, AWS, GCP) や Hugging Face のモデルを使って、音声認識+翻訳までの流れを確認 |
② ローカル環境で事前学習済みモデルを使い、コードを読む&Fine-tuningを試す | Whisper (ASR) + mBART (翻訳) をローカル環境で動かし、微調整(Fine-tuning)を行う |
③ API化やDocker化、クラウド展開 | FastAPIやFlaskでAPI化、Dockerコンテナ化、Azure/AWSへデプロイ |
④ MLOps(監視・CI/CD)の導入 | モデルのバージョン管理、MLflow、CI/CD、自動デプロイを試す |
合計想定期間 | 全体で約3〜4週間 |
理解が深まれば、役立ちそうなリンク集
はじめに — 機械学習帳
1. 単回帰
2. 重回帰
3. モデル選択と正則化
4. 勾配法によるパラメータ推定
5. 線形二値分類
6. 線形多クラス分類
7. ニューラルネットワーク (1)
8. ニューラルネットワーク (2)
大学が公開しているエンジニア向け学習資料まとめ
コードで学ぶAWS入門
東京大学 数理・情報教育研究センター
人工知能を学ぶためのロードマップ – 東京大学松尾・岩澤研究室(松尾研)- Matsuo Lab
誰でもわかる強化学習 – Speaker Deck
プログラミング演習 Python
Python 学習教材
統計の入門
Python – CS50 for Japanese: コンピュータサイエンスの入門(翻訳して見れる時見る・・)