interviewScribeは、テープ起こし作業を効率的に行うためのツールです。
- フレーズ分割
interviewScribeでは音声データを、発音している部分毎に分割し、「フレーズ」として管理します。
フレーズに分割することで、数秒のフレーズ毎に聞き取り作業を進められ、再生、聞き取り、テキス ト変換の一連の作業をスムーズに進めることが出来ます。
- テープ起こし作業に特化した機能
interviewScribeでは、テープ起こし作業を考慮し、ダイレクトな再生位置の設定、再生速度の調整、 再生音質の調整、フレーズの自動分割など、テープ起こし作業に特化した機能を持っています。
- Siri品質の音声テキスト変換
Catalinaにて公開されたSpeech recognition frameworkを使用し、Siri品質の音声テキスト変換が行える様になりました。
※※※※
良質な音声データ(例えばPodcastで配信されているニュース音声等)なら、驚 くほど簡単にテキストへ変換することが出来ますが、一般的な音声ソースでは、キータイプした方が効率的に作業を進められます。
- 聞き取り結果の出力
フレーズ毎に変換されたテキストを結合して、聞き取り結果テキストとして書き出すことが出来ま す。フレーズテキストの結合では、発音時間や話者がわかるようなヘッダーを付けることが出来ます。ま たヘッダーはsrtファイルフォーマットに準拠しているため、聞き取り結果テキストを動画の字幕テキス トとして使用することが出来ます。