まだ手で疲弊してる?文字起こし業務を見直そう

mail_hatarabo_archives_8.jpg

文字起こしに手間取るのは、もはや化石?

商談相手との打ち合わせや社内会議の議事録作成、セミナーやインタビューなど、後々のために記録を取っておきたい時、すべてをリアルタイムにテキストでメモすることはなかなか難しいですよね。そのため、ビジネスシーンでボイスレコーダーを活用しているという方は多いのではないでしょうか。

しかし、録音しておいたものの、確認したい場所がなかなか見つからなかったり、後で聞き返して文字に起こすといった作業を行うのに、大変な労力を要していませんか。聞いては止め、聞いては止め。やったことのある人でしか分からないその手間は、時間も集中力も要し、大きな作業負担を強いるものです。

こうした単純作業ながら負担の大きい”文字起こし”に対し、現場のニーズを汲み取って、効率化を促すさまざまなツールが生み出されています。昨今は精度が飛躍的に向上したと言われるこの文字起こしツールに、今回はスポットを当ててみましょう。

shutterstock_596648285.jpg

 

音声入力やアプリを活用!

文字起こし作業に社員の貴重な労働時間を割かないため、アルバイトを雇ったり、クラウドソーシングなどを通じて外注するケースもあります。確かにそうすればある程度のコストと手間を削減することができますが、内容に秘匿性の高い情報を含む場合は解決策にはなりません。やはり内部で処理したいところです。

実は、すでにMac、Windows、そしてGoogleドキュメントには、音声入力の機能が標準実装されています。この機能を使えば、話しかけた音声をテキストで出力できます。つまり、ボイスレコーダーに録音した音声音源があれば、それを聞かせることで実質的に文字起こしを無料で自動化実行することが可能なのです。

また、iOSのSiriなどの音声認識機能を持ち、指示通りに操作できるエンジンが複数開発されているため、これを用いることで文字起こし・テープ起こしができるスマートフォン向けアプリも数多くリリースされています。付随する機能や性能、UIにはそれぞれ特徴があり、料金も無料のものから有料のものまでさまざまです。

 

文字起こしに使えるアプリやソフト

Recoco

iPhone向けアプリ「Recoco」は、Siriの音声認識エンジンを用い、会議などでメンバーの発言を録音しながら自動的にテキスト化も行ってくれます。テキスト化された文章にはタイムスタンプが付与され、任意の場所からの確認・再生ができるほか、会議中に重要だと思った場所へタグを付けておくこともできるため、後で見直す際にとても便利です。テキスト化したデータの転送もできるので、情報共有もスムーズに行えるでしょう。いずれの機能も無料で利用でき、認識精度も約9割とかなり高くなっています。

Voice Rep Pro 2

Googleの音声認識エンジンを搭載したソフトで、音声ファイルからのテキスト化、音声読み上げ、英語やフランス語、ドイツ語、中国語、韓国語など多言語の音声認識に対応しています。さらに、再生を開始しさえすれば少しずつテキスト化を進める作業を完全自動で行う「お任せ自動文字化」機能や、認識時の音声レベル判定、数値表記の自動変換機能なども揃っており、非常に高性能なツールとして活用できます。変換精度も安定して高くなっていますが、有料ツールとなります。機能が限定される「Voice Rep 2」やお試し版が用意されているので、それらから検討するのも良いでしょう。

ドラゴンスピーチ

政治経済やIT用語、同音異義語などにも強い音声認識入力ソフトで、ICレコーダーやスマートフォンを用いたテキスト変換、直接音声入力によるテキスト化などがスムーズに行えます。修正ボックスツールによってその場で結果の修正編集が行え、修正データを蓄積・学習できるソフトなので
、使えば使うほど精度が向上していくという強みがあります。搭載辞書の豊富さ、精度と反応速度の高さでも高い評価を得ており、ビジネス利用にも十分です。有料ソフトで、マイクやレコーダーなど関連製品の販売も行われています。

AmiVoice

Windows上で動作する主要アプリに対応した音声認識ソフトで、多くの人に指示されています。特徴は、用途に応じて適切なマスター辞書を選択することにより、認識精度が向上する点でしょう。ICレコーダーからのテキスト化も可能で、自動学習機能や同音異義語の簡単修正、ファイルからの書き起こしをサポートする「書起しエディター」といった便利機能もあります。専用マイク付きの有料セットで提供されるスタイルとなっていますが、お試し体験版があるのでまずはダウンロードして試してみると良いでしょう。

 

意外な既存ツールの活用も

中には、普段から使っているアプリやツールが活用できるケースもあります。例えばビジネスシーンでの利用が高い「Evernote」は、スマートフォンアプリで音声テキスト変換を実行することができます。変換中もキーボード操作が行えるため、修正を並行して実行でき、効率よく作業できるでしょう。iPhoneであればSiriの音声入力ボタンから入力、Android端末であれば「口述で入力」を選択し、マイクを通して入力します。

AI技術によって精度の高い翻訳を可能にした「Microsoft Translator」も、文字起こしに応用できる無料アプリです。自然な発話でも高精度に認識されるようになり、リアルなコミュニケーションで”使える”翻訳アプリとなっており、翻訳元と翻訳先の言語を同じものに設定すれば、音声入力のテキスト化が可能です。テキスト化した結果を簡単に他のアプリと連携できるので、意外に幅広く活用できるかもしれません。

 

100%完璧ではないことを念頭に利用を

このように、さまざまな便利ツールやアプリが登場し、かなりのクオリティで文字起こしの自動化ができるようになっていますが、相当程度に発達したとはいえ、技術はなお進化の途上であり、100%完璧な結果は得られません。

特に多くのツールで課題となっているのが音量の問題です。人間であれば問題なく聴き取れるレベルでも、マイクから離れたり話し手が変わって音量が変動すると、正しく検出できなくなったり、ノイズと認識されてカットされたりするケースがしばしば見られます。

重要な会議の記録や正式な文書など、ミスが許されない場合、従来通り人間が行う方が適切ということもあります。そこまでのデータでない場合でも、修正チェックと編集の作業にはやはり手間がかかるので、修正のしやすさを考慮してツールを選択しておくことをお薦めします。

また、同じ読み手がマイクから一定の距離で読み上げると精度が非常に向上するものも多いため、改めて音声入力のみ行うという方法もあります。読み上げることで内容を頭に入れつつ、タイプ操作の手間はカットしたい時、プレゼンのアイデアメモ資料にしたい時などには、こうしたテキスト化が向くのではないでしょうか。

認識精度の面から、文字起こしツールはやはりまだまだ完全自動とはいかない、かえって手間がかかると感じる方もいるかもしれません。しかし技術は確実に進歩しています。そのため、かつて試用してみたもののその結果にがっかりした経験がある方が、改めて試してその精度に驚き、効率の良い使い方、取り入れ方を見つけられるという可能性も非常に高くなっています。

まずはこれまでの方法と並行して試しに活用し、業務効率化を図ることができないか、ぜひ検討してみてください。

 

 

mail_hatarabo_archives_8.jpg

この記事に関連するタグ