◆ ◆ ステップ1:環境構築と準備 ◆ ◆
このステップで学ぶこと
AzureのAPIを利用するための準備
Python環境のセットアップ(必要なライブラリのインストール)
APIキーの取得方法
目次
📝 ① Azureアカウント & Speech Serviceセットアップ
Azureの音声認識(Speech-to-Text)を使うには、Azure Speech Service を設定する必要があります。
1. Azure アカウントを作成
まだAzureアカウントを持っていない場合は、以下のURLから無料アカウントを作成してください(無料クレジットが付与されます)。
🔗 Azure アカウント作成
2. Speech Service のリソース作成
- Azure ポータル(https://portal.azure.com/)にログイン
- 「リソースの作成」 をクリック
- 「Speech」または「音声サービス」と検索し、Cognitive Services – Speech を選択
- 以下の情報を入力
- サブスクリプション: 利用可能なサブスクリプションを選択
- リソースグループ: 「新規作成」→ 任意の名前を入力(例:SpeechGroup)
- リージョン: 東アジア(East Asia) など、日本から近い場所を選択
- 名前: 任意の名前(例:mySpeechService)
- 価格プラン: 無料(F0)または標準(S0)
- 作成をクリックし、デプロイが完了するまで待つ
・リソースグループ で作成
・Azure AI Service のリソース作成

📝 ② API キーの取得
- Azure ポータルで「リソース」 → 「mySpeechService(作成したリソース)」 を開く
- 左側のメニューで「キーとエンドポイント」をクリック
- Key1 または Key2 をコピー(APIキー)
- エンドポイント URL をコピー
(例:https://eastasia.api.cognitive.microsoft.com/
)

これで、Azure Speech-to-Text API を使う準備ができました!🎉
📝 ③ Python環境のセットアップ
AzureのSpeech-to-Textを動かすには、Pythonライブラリをインストールする必要があります。
1. Pythonをインストール
Python 3.8 以上が推奨されます。
すでにインストールされているか確認するには、ターミナルやコマンドプロンプトで以下を実行:
python --version
例:
Python 3.9.7
もしインストールされていなければ、以下のサイトからダウンロードしてください。
🔗 Python公式サイト


2. 仮想環境(推奨)
仮想環境を作ることで、Pythonのパッケージ管理がしやすくなります。
python -m venv azure_speech_env
source azure_speech_env/bin/activate # macOS/Linux
azure_speech_env\Scripts\activate # Windows
3. 必要なライブラリをインストール
pip install azure-cognitiveservices-speech librosa numpy matplotlib requests
📝 ④ 音声データの準備
実験のために、音声ファイル(WAV形式)を用意しましょう。
- 自分の声を録音する
- Windows: 「ボイスレコーダー」アプリを使用
- macOS: 「QuickTime Player」→「新規オーディオ録音」
- スマホ: 標準の録音アプリで「Hello, this is a test.」と言って録音
- ファイル形式をWAVに変換
- AudacityやFFmpegを使って
sample_audio.wav
に変換
- AudacityやFFmpegを使って
📌 次のステップ
✅ Azureの設定が完了
✅ APIキーとエンドポイントを取得
✅ Python環境を準備
✅ 音声ファイルを用意