向かい風参考記録

陸上競技 その他 いろいろ

Googleドキュメントなどの音声入力を上手く使えば会議の書き起こし作業が省力化できるかも

f:id:Wetland:20200607234912j:plain

世の中には「時間を奪う」無駄としか思えない仕事がたくさんあります。思うに「会議内容の書き起こし」もそのひとつではないでしょうか。立て続けに会議が入り、書き起こしが終わっていない録音データだけが積み残される…という最悪の事態を回避するためにも、できるだけ早く仕上げることが求められます。

今回は備忘録を兼ね、書き起こし作業をアシストしてくれそうなツールをご紹介したいと思います。

Googleドキュメントの音声入力

「音声入力」の機能を持つツール自体は以前からありましたが、近年になって各社ツールの精度が飛躍的に上がってきています。中でもGoogleはAI音声認識を利用した高精度の自動文字起こしアプリを開発するなど、この分野では一歩抜けている印象があります。

Googleドキュメントの音声入力はそういったツールのひとつですが、無料版にしてはかなりの精度だと感じました。

使い方

Googleドキュメントの音声入力はPC・スマホ両方で利用可能です。PCの場合はGoogle ChromeでGoogleドキュメントにアクセスし「ツール」から「音声入力」が可能です。

f:id:Wetland:20200608005936p:plain

最近のPCは別途接続せずともマイクを内蔵しているものが多いので、だいたいそのまま使って問題ないかと思います。ただ対応ブラウザはGoogle Chromeのみなので注意が必要です。

スマホ版はブラウザ経由ではなく、アプリをインストールする必要があります。

Google ドキュメント: 同期、編集、共有

Google ドキュメント: 同期、編集、共有

  • Google LLC
  • 仕事効率化
  • 無料

今回は手元のiPhoneを使います。スマホ版の操作方法はシンプルで、文字入力の際にマイクのアイコンをタップするだけです。

f:id:Wetland:20200608010413j:plain

f:id:Wetland:20200608010426j:plain

この画像でいうと右下のマイクアイコンです。これをタップして入力します。

f:id:Wetland:20200608010432j:plain

後は話していくだけです。多少声が小さかったり滑舌の悪い話し方でもかなり拾ってくれるます。また、どういう技術なのか前後の文脈から勝手に漢字を変換してくれます。

f:id:Wetland:20200608010948p:plain

一部変換が乱れているところもありますが、これは後から手入力で直せます。十分に及第点といえましょう。

f:id:Wetland:20200608010506p:plain

さすがに句読点は後から手打ちする必要がありますが、認識・入力スピードもまさにリアルタイム。上手く使いこなせば書き起こし作業のアシストとしては有用なツールになり得ると感じました。

注意点・気になった点

かなりの精度で音声を認識できるとはいえ、次の点は気になりました。

  • 無音が続くと勝手に音声入力モードが終わる
  • スピーカーから音声を拾うと認識精度が落ちる

勝手に落ちる問題は設定で解決できるものではないので、ICレコーダーのように起動させて置きっ放しにはできないということです。

後者はPC自身がスピーカーから出た音をマイクで拾わないようにするハウリング防止機能の影響かと思われます。リモート会議の音声をリアルタイムで処理していくには向いていないかもしれません。

詳細設定や類似ツール

調べているうちにいくつか実用性のありそうな設定やツールが出てきましたので、一緒にご紹介したいと思います。

SoundFlowerを併用する

一部ではけっこう有名な手法のようですが「SoundFlower」を使うことで「スピーカーから出るはずの音が外に出ずにマイクから入っている」という処理ができます。これによりハウリング防止機能の影響を受けず、録音したデータをもとに音声入力が可能になります。

詳しく紹介されているブログがありますので、今回は細かい設定など言及しません。

writer.appを使う

Googleドキュメントとは別ツールになりますが「writer.app」を組み合わせて使う方法もあるようです。こちらは無音状態でも勝手に落ちたりしないので、場面に応じて使い分けていくのが良いかもしれません。

まとめ

  • 音声入力ツールは年々精度を上げてきている
  • 現状は一つのツールで会議の書き起こしを完結するのは難しい

現段階ではあくまで音声認識は補助ツールとしての位置づけになると思います。もちろん使う側の知恵や工夫ひとつで有用なツールとなるのは間違いありません。録音データの音質が悪い場合は、アナログですが聞き取った内容を復唱して音声入力するという方法もあります。

もともと視覚障害者向けに開発された「Live Transcribe」も精度を上げてきている(このツールは同時翻訳もできる)という情報を目にします。今後ますますこのテの書き起こし作業が省力化されるのを願うばかりです。

 

今回はここまで。