まだ手で疲弊してる?文字起こし業務を見直そう

From: 働き方改革ラボ

2023年06月19日 07:00

この記事に書いてあること

文字起こしに手間取るのは、もはや化石?

商談相手との打ち合わせや社内会議の議事録作成、セミナーやインタビューなど、後々のために記録を取っておきたい時、すべてをリアルタイムにテキストでメモすることはなかなか難しいですよね。そのため、ビジネスシーンでボイスレコーダーを活用しているという方は多いのではないでしょうか。

しかし、録音しておいたものの、確認したい場所がなかなか見つからなかったり、後で聞き返して文字に起こすといった作業を行うのに、大変な労力を要していませんか。聞いては止め、聞いては止め。やったことのある人でしか分からないその手間は、時間も集中力も要し、大きな作業負担を強いるものです。

こうした単純作業ながら負担の大きい"文字起こし"に対し、現場のニーズを汲み取って、効率化を促すさまざまなツールが生み出されています。昨今は精度が飛躍的に向上したと言われるこの文字起こしツールに、今回はスポットを当ててみましょう。

※2018年2月に公開した記事を更新しました

音声入力やアプリを活用!

文字起こし作業に社員の貴重な労働時間を割かないため、アルバイトを雇ったり、クラウドソーシングなどを通じて外注するケースもあります。確かにそうすればある程度のコストと手間を削減することができますが、内容に秘匿性の高い情報を含む場合は解決策にはなりません。やはり内部で処理したいところです。

実は、すでにMac、Windows、そしてGoogleドキュメントには、音声入力の機能が標準実装されています。この機能を使えば、話しかけた音声をテキストで出力できます。つまり、ボイスレコーダーに録音した音声音源があれば、それを聞かせることで実質的に文字起こしを無料で自動化実行することが可能なのです。

また、iOSのSiriなどの音声認識機能を持ち、指示通りに操作できるエンジンが複数開発されているため、これを用いることで文字起こし・テープ起こしができるスマートフォン向けアプリも数多くリリースされています。付随する機能や性能、UIにはそれぞれ特徴があり、料金も無料のものから有料のものまでさまざまです。

文字起こしに使えるサービス

「toruno(トルノ)」

会議を「文字起こし+録音+画面キャプチャ」で自動記録するクラウドサービスで、株式会社リコーが提供しています。Web会議や会議室で行われる会議、それらを組み合わせたハイブリッド会議など、普段の会議シーンで使えるので、議事録作成の時短化、音声や動画の文字起こし、会議の聞き直し、情報共有などに活用できます。普段使っているマイク付きイヤホンやマイク付きスピーカーで文字起こしを体感できます。無料トライアルもあるので、普段お使いの音声デバイスとの相性や実際の使い勝手、文字起こし精度を試してみると良いでしょう。

toruno(トルノ)│株式会社リコー

意外な既存ツールの活用も

中には、普段から使っているアプリやツールが活用できるケースもあります。例えばビジネスシーンでの利用が高い「Evernote」は、スマートフォンアプリで音声テキスト変換を実行することができます。変換中もキーボード操作が行えるため、修正を並行して実行でき、効率よく作業できるでしょう。iPhoneであればSiriの音声入力ボタンから入力、Android端末であれば「口述で入力」を選択し、マイクを通して入力します。

AI技術によって精度の高い翻訳を可能にした「Microsoft Translator」も、文字起こしに応用できる無料アプリです。自然な発話でも高精度に認識されるようになり、リアルなコミュニケーションで"使える"翻訳アプリとなっており、翻訳元と翻訳先の言語を同じものに設定すれば、音声入力のテキスト化が可能です。テキスト化した結果を簡単に他のアプリと連携できるので、意外に幅広く活用できるかもしれません。

また、最近ではMicrosoft Teamsやzoomなどの広く使用されているWeb会議ソフトでも文字起こし機能が搭載されています。ライセンスや設定によって使用方法は異なりますので、まずは現状お使いのWeb会議ソフトの最新バージョンを確認してみるとよいでしょう。

参考記事(別サイトが開きます)
Microsoft Teams の文字起こしの使い方
Zoomの文字起こしの使い方

100%完璧ではないことを念頭に利用を

このように、さまざまな便利ツールやアプリが登場し、かなりのクオリティで文字起こしの自動化ができるようになっていますが、相当程度に発達したとはいえ、技術はなお進化の途上であり、100%完璧な結果は得られません。

特に多くのツールで課題となっているのが音量の問題です。人間であれば問題なく聴き取れるレベルでも、マイクから離れたり話し手が変わって音量が変動すると、正しく検出できなくなったり、ノイズと認識されてカットされたりするケースがしばしば見られます。

例えば文字起こしツールを使う際は、1人で入るWeb会議の場合はマイク付きイヤホンを利用し、複数名が会議室に集まって行う会議の場合は前述の360°カメラマイク付きスピーカー「RICOH Meeting 360」などを利用することで、音量・音質が改善されます。

重要な会議の記録や正式な文書など、ミスが許されない場合、従来通り人間が行う方が適切ということもあります。そこまでのデータでない場合でも、修正チェックと編集の作業にはやはり手間がかかるので、修正のしやすさを考慮してツールを選択しておくことをお薦めします。

また、同じ読み手がマイクから一定の距離で読み上げると精度が非常に向上するものも多いため、改めて音声入力のみ行うという方法もあります。読み上げることで内容を頭に入れつつ、タイプ操作の手間はカットしたい時、プレゼンのアイデアメモ資料にしたい時などには、こうしたテキスト化が向くのではないでしょうか。

認識精度の面から、文字起こしツールはやはりまだまだ完全自動とはいかない、かえって手間がかかると感じる方もいるかもしれません。しかし技術は確実に進歩しています。そのため、かつて試用してみたもののその結果にがっかりした経験がある方が、改めて試してその精度に驚き、効率の良い使い方、取り入れ方を見つけられるという可能性も非常に高くなっています。

まずはこれまでの方法と並行して試しに活用し、業務効率化を図ることができないか、ぜひ検討してみてください。


記事執筆

働き方改革ラボ 編集部 (リコージャパン株式会社運営

「働き方改革ラボ」は、”働き方改革”が他人ゴトから自分ゴトになるきっかけ『!』を発信するメディアサイトです。
「働き方改革って、こうだったんだ!」「こんな働き方、いいかも!」
そんなきっかけ『!』になるコンテンツを提供してまいります。新着情報はFacebookにてお知らせいたします。

記事タイトルとURLをコピーしました!

https://www.ricoh.co.jp/magazines/workstyle/column/transcription-automation/

業種別で探す

テーマ別で探す

お問い合わせ

働き方改革ラボに関連するご質問・お問い合わせは
こちらから受け付けています。お気軽にご相談ください。

お問い合わせ