音声ストリーミング(英語)→音声ファイル(MP3)→分割・結合→自動文字起こし→自動翻訳(日本語)→読み上げ(日本語)→音声ファイル(MP3:日本語)2021年03月19日 03:56

音声ストリーミング(英語)→音声ファイル(MP3:英語)→分割・結合→自動文字起こし→自動翻訳(日本語)→読み上げ(日本語)→音声ファイル(MP3:日本語)


エリックバーガーがスペースX黎明期の本を書いて、それをオーディオブックで聞いている話は既に書いた。

(キンドル本をタダで聴く:英語だけど:30日間(無料お試し期間)だけど)
http://kfujito2.asablo.jp/blog/2021/03/12/9356217

「英語版のキンドル本は、2508円だから、買って惜しい値段ではない。」

その2500円余りが惜しくて、音声ストリーミングを録音して、MP3ファイルに落とした話も書いた。

「音声版は、録音ソフトで手元に残す(あくまで、個人利用です)。」

で、今日は、そのMP3ファイルを再生して、自動文字起こしでテキストファイルに変換し、更には自動翻訳の後に、その日本語テキストファイルを読み上げソフトで日本語音声でMP3ファイルに出力するという作業を行った。

各作業で使用したソフトは、以下の通り。

①アマゾン(オーディブル):ストリーミング読み上げ(英語):30日間無料お試し中(素材は「Liftoff」)。

先に引用した記事に詳細記載。

②Renee Audio Tools(録音機能のみ):音声ストリーミング→録音してMP3ファイル作成:非商用利用は無料。

(Renee Audio Tools)
https://multimedia.reneelab.jp/audio-tools

32ビット環境で動いた最初のソフトというだけで、特に選んだわけではない。

③Audio Editor:MP3編集(分割):すでにメンテのリンクが切れているフリーのツールだが、テキトーに選んだ。

(AudioEditor)
https://www.gigafree.net/media/se/audioeditor.html

無劣化で切り張りできるが、操作は癖が強い。

まだ使いこなせていないけど、無劣化なのでいいかな・・・。

④Googleドキュメント:自動文字起こし:ウインドウズ系のフリーの作業環境としては定番の様です。

(寝てる間にテキスト化!?Googleドキュメントで取材音源を自動で文字起こしをする方法)
https://ferret-plus.com/19311

時々、文字起こしが途切れたりするので(パソコンが非力なため?)、寝ている間に終わっているというわけにはいかないかもしれない。

グーグルドキュメント自体にオンライン環境が必要なため、ネット接続が切れたりすると文字起こしも途切れることがあるだろう(未確認)。

浮沈子は、ノートパソコンにUSB接続の外部スピーカーを繋いでいるので、サウンド設定でサウンドコントロールパネルから「ステレオミキサー」を既定のデバイスに設定した後も、サウンド設定の「出力デバイス」を内部スピーカー(のドライバー)にしないと、グーグルドキュメントが入力デバイス(内部出力?)を認識しなかったけどな(やや格闘)。

⑤Googleドキュメント:自動翻訳(英語→日本語):「ツール」の「ドキュメントの翻訳機能」を選択して日本語に設定すると自動でファイルを作ってくれる。

⑥テキストーク:日本語読み上げソフト(MP3ファイル出力):何でもよかったんだが、フリーのローカル環境で動くというので選んだ。

(テキストーク)
https://forest.watch.impress.co.jp/library/software/textalk/

「MP3/WAVE形式で保存することも可能」

「読み方を登録した“読み仮名辞書”を作成」

「SpaceX→すぺーすえっくす」と登録したら、ちゃんと読めるようになった(えすぴーえーしーいーえっくす、とか、初めはワケワカ・・・)。

仕事じゃないからな。

テキトーでいいのだ。

国際会議とかで、リアルタイムで翻訳ソフトかませて、通訳するとか、会議終了後に議事録やサマリー作成して稟議決裁するなどのお仕事用には、それなりのスイートが必要だろう。

グーグルドキュメントによる文字起こし(④の作業)は、今日初めてやってみたが、句読点が付かないので手動で付けてみたが、ベタ文から自動翻訳しても(⑤の作業)、翻訳エンジンがテキトーに区切ってくれるので、そのままでもなんとかなりそうな感じだ。

読み上げソフトの音声選択は、女性(日本語)[Microsoft Haruka Desktop]を選択した。

バッファの関係からか、男性の音声だと、途中で再生速度が低下して幽霊のような感じになっちまったからな(パソコン環境によると思います)。

英語のMP3ファイル再生から文字起こしの精度、英語ベタ文からの自動翻訳はグーグル様任せだ。

精度はそれなりだし、タダより安い物はないので文句は言えない(結局、翻訳本が出れば買うわけだがな)。

テキストークでのMP3ファイルの作成はスムーズで、リアルタイムで聞くよりも、ファイルに吐かせてから聞いた方がいいかも知れない。

このスタイルがスムーズに行けば、フリーソフトを繋ぎ合わせて、自動翻訳スイートを作れるかもしれないな(もうあるだろうな)。

ネット接続さえあれば、そのうちリアルタイムの翻訳が可能になるだろう。

ルマンに行って、英語が通じないのに辟易したけど、パン屋のおばちゃんにも通じるようになるわけだ。

自動翻訳で世界中が繋がるようになれば、きっと何かが変わるだろう。

スターリンクで世界中の情報の垣根が取り払われ、ウソも誠もあからさまになる時代が目の前に訪れようとしている。

英語の全音声ファイルを日本語化して、ローカル環境に入れて持ち歩くのが当面の目標だ。

殆どの作業は、パソコンが寝ている間にやってくれる。

いい時代になったものだ。

読み書きそろばんが出来なくても、パソコン(今じゃスマホ?)のスキルがあれば、そこそこのことはやってくれる。

まあ、みんながそこそこじゃあ、おまんまを食うわけにはいかないからな。

完成度の高さ(精度含めて)の点では、プロの活躍の場は大きいだろうな・・・。

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※なお、送られたコメントはブログの管理者が確認するまで公開されません。

※投稿には管理者が設定した質問に答える必要があります。

名前:
メールアドレス:
URL:
次の質問に答えてください:
kfujitoの徒然の筆者のペンネームは、
「○○子」です。
○○を記入してください。

コメント:

トラックバック