会議をレコーディングした動画ファイルから議事録要点メモを自動生成する方法
ZOOMでレコーディングを行い、動画ファイルをローカルで作成する方法
PythonからOpenAIのWhisperモジュールを利用して音声ファイルに対し音声認識を行う方法
ChatGPTのAPIをPythonから利用し会議内容の要点を出力させる方法
FFMPEGをPythonから利用し、動画ファイルから音声ファイルを作成する方法
Python Flaskの環境構築方法
Whisper_MICのデプロイ方法
Python FlaskのWebアプリでAjaxリクエストを出す方法
Python FlaskのWebアプリでAjaxリクエストでWhisper音声認識の結果取得を行う方法
◇この講座でできるようになること
・(中級者向け)ZOOMやTeamsなどのオンライン会議レコーディングファイルもしくは音声ファイルからの
議事録自動作成(Colab)をPythonでモジュールとAPIの呼び出しのみ(非常に少ないコード)で行います。
・(中~上級者向け)Python Flaskを用いてローカル環境(インターネット接続なし)で動作する本格的な音声認識システムを
構築できます。バックエンドはOpenAIのWhisperモデルなので、認識精度はかなり高いです。
◇この講座の構成
-
動画ファイル or 音声ファイルのアップロード
-
動画ファイルからの音声ファイル作成
-
音声ファイルからのテキスト抽出(音声認識)
-
音声認識テキストからの要点抽出(自動要約)←ChatGPT(gpt3.5/gpt4.0)にプロンプト生成してもらいました。
-
要点抽出結果のダウンロード
-
Flask環境の構築
-
ミニマムなFlaskアプリ
-
Whisper_MIC
-
Flask画面パーツ
-
Stable Diffusionでfavicon
-
Bootstrap
-
Ajax
-
デモ
-
システム構成
-
Whisper_MICとファイル連携
-
仕上げ
You can view and review the lecture materials indefinitely, like an on-demand channel.
Definitely! If you have an internet connection, courses on Udemy are available on any device at any time. If you don't have an internet connection, some instructors also let their students download course lectures. That's up to the instructor though, so make sure you get on their good side!