私たちは何年もの間、正確、リアルタイム、そして簡単な 音声ディクテーション を約束されてきました。今日、その約束は(ほぼ)実現しましたが、次の仕事のレポート、論文、または小説を自分の声を使って書くべきでしょうか?結局のところ、そうではないかもしれません。
私たちは話すように書くのではない
本格的なライティングを口述筆記する際の最大の問題は、読むこととは異なり、書くことは直線的なプロセスではないことです。私たちは段落や文章全体をその場で考え出すことはしないので、書き言葉を話すことはほとんど効率的ではありません。
代わりに、書き込みは行ったり来たりします。私たちは立ち止まって考えます。考えがまとまったら、言葉を大量に入力します。現在のディクテーション システムの仕組みでは、この自然な執筆リズムをスムーズに機能させるのは困難です。別の方法は、書き方を口述筆記に適応させることです。この著者は確かに試してみましたが、何を書くにしても、執筆プロセスには役に立たないようです。
フォーマットと編集は依然として面倒
かなりの量の文章は、単にテキストの書式設定と編集を行うだけです。完璧な句読点と書式設定を実現できるディクテーション システムはありません。それらの中には、カンマとピリオドをどこに置くべきかを推測するものもあり、多くの場合、素晴らしい仕事をします。ただし、最も信頼できる方法は、句読点をどこに置くか、いつ太字や斜体のテキストを作成するかなどを口頭でシステムに明示的に伝えることです。
音声を使用して テキストをフォーマットする ことは、最初から事実上禁止されています。触覚コントロールを使用する方が単純に速くて効率的です。音声によるフォーマットよりも、タッチ コントロールでも機能します。したがって、最初の音声草案がどれほどうまくできたとしても、必然的に、戻って手動で入力する必要があります。
共有スペースでは音声ディクテーションが機能しない
多くの人が が、オープンプランのオフィスやその他の共同ワークスペースは依然として一般的です。このため、ノイズが発生するような方法でテキストを作成することが問題になります。 メカニカルキーボードは、 誰かがメカニカルキーボードで記事を練り上げているときにすでに煩わしいものですが、コンピューターに向かって話している人でいっぱいの部屋を想像できますか?
また、 ヘッドフォン を着用しない限り、たとえば、執筆中に音楽やその他のオーディオ コンテンツを聴くこともできなくなります。全体として、音声ディクテーションによって引き起こされる騒音公害により、快適に使用できる環境や状況の種類が狭まってしまいます。
話しすぎると体に悪影響を与える可能性があります
音声ディクテーションが主流の執筆モードにならないもう 1 つの潜在的な理由は、何時間も話し続けるのは誰の声にとっても良くないことです。過度のタイピングが手に負担をかけないというわけではありませんが、私たちはより良い タイピングの人間工学 を見つけるのに何十年も費やしてきました。結局のところ、私たちは「人間工学に基づいた」マイクを持っていません。
優れたハンズフリーのモバイル タイピング テクノロジです
音声ディクテーションが真価を発揮するのは、ハンズフリーでテキストの小さなセクションを書き込む場合です。運転中にお気に入りのアプリで使用するテキスト メッセージを口述筆記するなどです。ハンズフリーで作業していない場合でも、音声入力は通常、小さなタッチスクリーン キーボードで入力するよりもストレスが少なくなります。少なくとも人間サイズの親指を持つ人にとっては。
したがって、 スマートフォンで音声入力を 試したことがない場合、これは実際にはこのテクノロジーの最良の使用例の 1 つです。定期的に携帯電話で入力を間違える傾向がある場合は、音声入力は間違いなく試してみる価値があります。
転写こそが本当のスター
これまでのところ、音声ディクテーションは思ったほど役に立たないことが判明しているように見えるかもしれませんが、それはこのテクノロジーをリアルタイムで使用しようとした場合に限ります。はるかに実用的なのは、音声録音を取得し、 それを編集可能なテキストに書き写すこと です。
音声ディクテーションとトランスクリプションは本質的に同じテクノロジーですが、トランスクリプションの場合、ソフトウェアが正しく処理するのにより多くの時間がかかり、録音全体のコンテキストを処理できる点が異なり、編集のために中断する必要があります。
専用のボイス レコーダー、携帯電話の録音アプリ、さらには スマート ウォッチ を使用すると、自分の考えを一定期間書き留めて、そのすべての音声を文字起こしソフトウェアに入力することができます。次に、最終結果を編集することになりますが、これはディクテーションの停止と開始の性質よりも高速でなければなりません。
したがって、音声認識テクノロジーは間違いなく使用すべきものですが、おそらくライブディクテーションはその恩恵を受ける最良の方法ではありません。





