学習


2025/02/10
3月頃に間に合わすよう2月から月末までをターゲットに予定を立ててみたが中々厳しいくなってきた。
最初からハンズオン形式を中心にやった方が良かったかと考えつつ、それでは行列ベクトルを理解せぬまま
ニューラルネットワークに挑むことになっていたので危なかった。微分から始める必要がないということも
知人からアドバイスされたが(学がある方の人)昔の事など覚えてないので学習し直してよかった。結局は
微分や線形回帰など再帰的な計算から近い結果を途方もないデータ量の中から正解らしきものに近づくには
その考え方が根底にないと前に進めなかった。やはり基礎部分の大枠な把握は必要のようだ。とはいいつつ
機械学習を学ぶにあたって、基礎、と呼ばれるものが多いので、幅広い知見が必要のようで、しょうがない。
時間はかかるが、初期に考えた段取りでコツコツ進めようと思う。GO言語は日数的に厳しそうだ。Udemy
講座を購入したが、それを無視して、基礎的構文が関の山かもしれない。

学習するのは、とても楽しいので、そこが今のモチベーションである。
仕事に良い形で繋げることが出来さえすれば、更に良い循環になるだろう。

早く何かしらのプロダクトを考えてUⅠ付きで作りたい。
ピンポイントなⅮX需要の課題に焦点を当てるのは良いかもしれない。
というところまで行けるまではまだ恐らく遠そうだ。学習していこう。。。




Week項目内容時間 (*学習中)学習形式学習状況
Week 1Pythonの基礎復習データ型、ループ、関数の基本操作*(0h)机上学習Python基礎
Jupyter Notebookの利用データ操作や可視化に使うツールの操作方法*(1h)
*(1h)
机上学習
ハンズオン
Jupyter Notebookとは
Jupyter Notebookを利用する
Pandas/Numpy基礎データフレームの作成と操作、数値データの処理*(0h)
*(0h)
ハンズオン未着手
Kaggleアカウント作成と基本操作Kaggleの基本的な使い方
データセット取得
*(2h)机上学習Kaggleアカウント作成
Kaggle基本操作
特徴量抽出データからモデルに適した特徴量を選択する方法机上学習未着手
線形代数
線形モデル
単回帰や重回帰の基礎
*微分
*偏微分
*単回帰
*重回帰
机上学習
スカラ・ベクトル・行列
線形回帰
微分/偏微分
単位行列と逆行列
単回帰分析
重回帰分析
非線形代数
非線形モデル
非線形手法の基礎と応用

活性化関数
活性化関数いろいろ
勾配降下法ディープラーニングにおける最適化アルゴリズムの基礎 (0h)机上学習勾配降下法
勾配降下法いろいろ
Week 2ニューラルネットワークの基本構造入力層、中間層、出力層
各層の役割
(0h)机上学習ニューラルネットワーク1
ニューラルネットワーク2
ニューラルネットワーク3
活性化関数ReLU, Sigmoid, Softmax
違いと用途
(0h)机上学習活性化関数
活性化関数いろいろ
誤差逆伝播法ニューラルネットワーク
学習アルゴリズムの理解
(0h)机上学習誤差逆伝播法
正則化ドロップアウト
L1正則化、L2正則化の理解
(0h)机上学習
未着手
モデル評価:検証データ分割データセットの分割手法を学習 (0h)ハンズオン未着手
モデル評価:混同行列混同行列の構築と分析 (0h)ハンズオン未着手
モデル評価:損失関数損失関数の計算と適用 (0h)ハンズオン未着手
Week 3音声波形とスペクトログラムの理解音声信号の周波数表現を学ぶ (0h)ハンズオン未着手
音声特徴量の抽出MFCCの理論と実装 (0h)ハンズオン未着手
音声分類話者認識や感情分類のためのモデル構築 (0h)ハンズオン未着手
音声APIの利用各クラウドの音声認識APIを比較・実装(AWS/Azure/Google Cloud) (0h)ハンズオン未着手
Gitの操作コミット、ブランチ管理 (0h)ハンズオン未着手
Docker構築Docker環境で音声処理アプリを実装 (0h)ハンズオン未着手
Week 4音声認識モデル音声→テキストの変換モデル構築 (0h)ハンズオン未着手
翻訳モデル英語→日本語翻訳モデル構築と評価 (0h)ハンズオン未着手
シーケンス・ツー・シーケンスモデル多言語翻訳で使われる基本モデル (0h)机上学習未着手
辞書追加とチューニング分野特化用語をモデルに反映する手法 (0h)ハンズオン未着手
Week 5プロジェクト仕上げ最終成果物の完成とデプロイメント (0h)ハンズオン未着手
実務シミュレーション学んだ技術を用いた模擬プロジェクト (0h)ハンズオン未着手
Pythonライブラリの実践TensorFlow/PyTorch, SpeechRecognition, librosaの実践 (0h)ハンズオン未着手
振り返りと次のステップ学習の総まとめと次の学習計画 (0h)机上学習未着手

全体の学習計画と期間の見積もり

ステップ主な作業内容
APIや事前学習済みモデルで「音声→翻訳」までを一通り動かすAPI (Azure, AWS, GCP) や Hugging Face のモデルを使って、音声認識+翻訳までの流れを確認
ローカル環境で事前学習済みモデルを使い、コードを読む&Fine-tuningを試すWhisper (ASR) + mBART (翻訳) をローカル環境で動かし、微調整(Fine-tuning)を行う
API化やDocker化、クラウド展開FastAPIやFlaskでAPI化、Dockerコンテナ化、Azure/AWSへデプロイ
MLOps(監視・CI/CD)の導入モデルのバージョン管理、MLflow、CI/CD、自動デプロイを試す
合計想定期間全体で約3〜4週間

理解が深まれば、役立ちそうなリンク集

はじめに — 機械学習帳
1. 単回帰
2. 重回帰
3. モデル選択と正則化
4. 勾配法によるパラメータ推定
5. 線形二値分類
6. 線形多クラス分類
7. ニューラルネットワーク (1)
8. ニューラルネットワーク (2)

大学が公開しているエンジニア向け学習資料まとめ
コードで学ぶAWS入門
東京大学 数理・情報教育研究センター

人工知能を学ぶためのロードマップ – 東京大学松尾・岩澤研究室(松尾研)- Matsuo Lab

誰でもわかる強化学習 – Speaker Deck
プログラミング演習 Python
Python 学習教材
統計の入門
Python – CS50 for Japanese: コンピュータサイエンスの入門(翻訳して見れる時見る・・)