ステップ1:環境構築と準備

◆ ◆ ステップ1:環境構築と準備 ◆ ◆

このステップで学ぶこと
AzureのAPIを利用するための準備
Python環境のセットアップ(必要なライブラリのインストール)
APIキーの取得方法


📝 ① Azureアカウント & Speech Serviceセットアップ

Azureの音声認識(Speech-to-Text)を使うには、Azure Speech Service を設定する必要があります。

1. Azure アカウントを作成

まだAzureアカウントを持っていない場合は、以下のURLから無料アカウントを作成してください(無料クレジットが付与されます)。
🔗 Azure アカウント作成

2. Speech Service のリソース作成

  1. Azure ポータル(https://portal.azure.com/)にログイン
  2. 「リソースの作成」 をクリック
  3. Speech」または「音声サービス」と検索し、Cognitive Services – Speech を選択
  4. 以下の情報を入力
    • サブスクリプション: 利用可能なサブスクリプションを選択
    • リソースグループ: 「新規作成」→ 任意の名前を入力(例:SpeechGroup)
    • リージョン: 東アジア(East Asia) など、日本から近い場所を選択
    • 名前: 任意の名前(例:mySpeechService)
    • 価格プラン: 無料(F0)または標準(S0)
  5. 作成をクリックし、デプロイが完了するまで待つ

リソースグループ で作成

・Azure AI Service のリソース作成


📝 ② API キーの取得

  1. Azure ポータルで「リソース」 → 「mySpeechService(作成したリソース)」 を開く
  2. 左側のメニューで「キーとエンドポイント」をクリック
  3. Key1 または Key2 をコピー(APIキー)
  4. エンドポイント URL をコピー
    (例: https://eastasia.api.cognitive.microsoft.com/

これで、Azure Speech-to-Text API を使う準備ができました!🎉

📝 ③ Python環境のセットアップ

AzureのSpeech-to-Textを動かすには、Pythonライブラリをインストールする必要があります。

1. Pythonをインストール

Python 3.8 以上が推奨されます。
すでにインストールされているか確認するには、ターミナルやコマンドプロンプトで以下を実行:

python --version

例:

Python 3.9.7

もしインストールされていなければ、以下のサイトからダウンロードしてください。
🔗 Python公式サイト

2. 仮想環境(推奨)

仮想環境を作ることで、Pythonのパッケージ管理がしやすくなります。

python -m venv azure_speech_env
source azure_speech_env/bin/activate  # macOS/Linux
azure_speech_env\Scripts\activate  # Windows

3. 必要なライブラリをインストール

pip install azure-cognitiveservices-speech librosa numpy matplotlib requests

📝 ④ 音声データの準備

実験のために、音声ファイル(WAV形式)を用意しましょう。

  1. 自分の声を録音する
    • Windows: 「ボイスレコーダー」アプリを使用
    • macOS: 「QuickTime Player」→「新規オーディオ録音」
    • スマホ: 標準の録音アプリで「Hello, this is a test.」と言って録音
  2. ファイル形式をWAVに変換
    • AudacityやFFmpegを使って sample_audio.wav に変換

📌 次のステップ

✅ Azureの設定が完了
✅ APIキーとエンドポイントを取得
✅ Python環境を準備
✅ 音声ファイルを用意

>> ◆ ステップ2:WAVファイルを使ってSTTを試す