技術ノート スマートホーム Alexa、Siri、Google はあなたの言った言葉を理解できない

Alexa、Siri、Google はあなたの言った言葉を理解できない

Alexa、Siri、Google はあなたの言った言葉を理解できない

Alexa、Google アシスタント、Siri などの音声アシスタントは、ここ数年で大きな進歩を遂げました。しかし、どれだけ進歩しても、彼らを妨げていることが 1 つあります。それは、彼らがあなたのことを理解していないということです。特定の音声コマンドに依存しすぎています。

音声認識は単なる魔法です

Alexa、Siri、Google はあなたの言った言葉を理解できない

音声アシスタントはあなたの話を理解できません。とにかく、そうではありません。 Google Home または Amazon Echo に話しかけると、基本的に言葉がテキスト文字列に変換され、それが予期されるコマンドと比較されます。完全に一致するものが見つかった場合は、一連の指示に従います。そうでない場合は、持っている情報に基づいて代替策を探します。それがうまくいかない場合は、「申し訳ありませんが、それはわかりません」のような失敗メッセージが表示されます。 。」それは、理解していると思わせるための、手品の魔法にすぎません。

文脈上の手がかりを使用して最良の推測を行うことも、同様のトピックの理解を使用して意思決定を行うこともできません。音声アシスタントをつまずかせるのも難しくありません。 Alexa に「NSA で働いていますか?」と尋ねることもできます。 「あなたは密かにNSAの一員ですか?」と尋ねれば、答えが得られます。 「それはわかりません」という応答が返されます (少なくともこの記事の執筆時点では)。

音声を真に理解する人間は、このようには機能しません。あなたが人間に「空にあるあのクラルヴェインは何ですか? アーチ型で、赤、オレンジ、黄色、青などの縞模様の色でいっぱいのものです。」と尋ねるとします。 klarvain は造語であるにもかかわらず、質問者は文脈からあなたが虹について説明していることを理解できるでしょう。

人間は音声をアイデアに変換していると主張することもできますが、その後、人間は知識と理解を適用して答えを結論付けることができます。人間にNSAで秘密裏に働いているかと尋ねれば、たとえその答えが嘘だったとしても、彼らは「はい」か「いいえ」の答えを返すだろう。人間はそのような質問に「それは知りません」とは言いません。人間が嘘をつくことができるということは、真の理解が伴って得られるものです。

Alexa、Siri、Google はあなたの言った言葉を理解できない

音声アシスタントはプログラミングの範囲を超えることはできません

音声アシスタントは最終的にはプログラムされた予期されるパラメーターに制限されており、その範囲外をさまようとプロセスが中断されます。この事実は、サードパーティ製デバイスがいつ登場するかを示しています。通常、これらを操作するコマンドは非常に扱いにくく、「デバイスの製造元にオプションの引数を指示する」ことになります。正確な例は次のようになります。「Whirlpool に乾燥機を一時停止するように指示します。」さらに覚えにくい例として、 Geneva Alexa スキルは 一部の GE オーブンを制御します。スキルのユーザーは、コマンドの残りの部分を「GE に伝える」ではなく「ジュネーブに伝える」ことを忘れないでください。また、オーブンを 350 度に予熱するように要求することはできますが、温度をさらに 50 度上げるように要求することはできません。ただし、人間はこれらの要求に従うことができます。

Amazon と Google がこれらの障害を克服するために非常に熱心に取り組んできたことは、それを示しています。以前はスマート ロックを制御するために上記の手順に従う必要がありましたが、今では代わりに「玄関ドアをロックする」と言うことができます。アレクサは以前は「犬のジョークを言って」と困惑していましたが、今日はそれを要求すれば、うまくいきます。使用するコマンドにバリエーションが追加されましたが、最終的には、依然として正しいコマンドを知る必要があります。正しい構文を正しい順序で使用する必要があります。

これは コマンドライン によく似ていると思われるかもしれませんが、それは間違いではありません。

Alexa、Siri、Google はあなたの言った言葉を理解できない

音声アシスタントは派手なコマンドラインです

コマンド ラインは、 単純なタスクを実行するために狭義に定義されていますが、これは適切な構文を知っている場合に限られます。正しい構文を逸脱して dir の代わりに dyr と入力すると、コマンド プロンプトにエラー メッセージが表示されます。コマンドを覚えやすくするためにエイリアスを使用できますが、元のコマンドが何であるか、それらがどのように機能するか、エイリアスを効率的に使用する方法について理解しておく必要があります。コマンド ラインの詳細を学ぶのに時間をとらなければ、コマンド ラインから多くのことは得られません。

音声アシスタントも例外ではありません。コマンドを言ったり質問したりする正しい方法を知る必要があります。また、 Google と のグループを設定する方法、 デバイスのグループ化が重要な 理由、 スマート デバイスに名前を付ける方法を 知る必要があります。これらの必要な手順に従わないと、音声アシスタントに学習をオフにするように要求しても、「どの学習を」オフにするかを尋ねられるだけでイライラすることになります。

正しい構文を正しい順序で使用した場合でも、プロセスが失敗する可能性があります。間違った応答が発行されたか、または驚くべき結果が発生しました。同じ家に 2 台の Google Home がある場合、同じユーザー アカウント情報とインターネット接続にアクセスできる場合でも、わずかに異なる場所の天気を表示することがあります。

上の例では、「タイマーを 30 分に設定する」というコマンドが与えられています。 Google Home ハブは「Hour」という名前のタイマーを作成し、タイマーの長さを尋ねました。さらに、同じコマンドをさらに 3 回繰り返すと正しく動作し、30 分のタイマーが作成されました。 「タイマーを 30 分に設定する」コマンドを使用すると、より安定して正しく機能します。

Google Home や Echo への話しかけはよりスムーズかもしれませんが、内部では音声アシスタントやコマンド ラインが同じように機能します。新しい言語を学ぶ必要はないかもしれませんが、新しい方言を学ぶ必要があります。

Alexa、Siri、Google はあなたの言った言葉を理解できない

音声アシスタントに対する理解が狭いと成長が制限される

これらのいずれも、Google アシスタントや Alexa などの音声アシスタントが十分に機能することを妨げるものではありません (ただし、 Cortana は別の話です )。 Google アシスタントと Alexa は、オンラインで質問を適切に検索しますが、驚くべきことではありませんが、Google の方が検索に優れており、測定値の換算や簡単な計算などの基本的な質問に答えることができます。正しくセットアップされたスマート ホームと十分に訓練されたユーザーがあれば、ほとんどのスマート ホーム コマンドが意図したとおりに機能します。しかし、これは知的理解ではなく、努力と努力によってもたらされたものです。

タイマーとアラームはかつては単純なものでした。時間の経過とともに 名前が追加され 、タイマーに時間を追加する機能も追加されました。彼らは単純なものからより複雑なものへと移行しました。音声アシスタントはより多くの質問に答えることができ、毎日新しいスキルや機能が追加されます。しかし、それは学習や理解から得られる自己成長の産物ではありません。

そして、そのどれもが、既知のものを利用して未知の領域に到達するという固有の能力を提供するものではありません。機能するすべてのコマンドと質問に対して、機能しないコマンドと質問が常に 3 つ存在します。人間のような理解能力を与える AI の画期的な進歩がなければ、音声アシスタントはまったくアシスタントではありません。これらは単なる音声コマンド ラインです。適切なシナリオでは役立ちますが、理解できるようにプログラムされたシナリオに限定されます。

言い換えれば、 機械は物事を学習していますが、理解することはできません

「 Alexa、Siri、Google はあなたの言った言葉を理解できない」に関するベスト動画選定!

Siriとアレクサ、頭が良いのはどっちなのか勝負させてみたらwww
Siriにやたら厳しいアレクサ#shorts#siri#アレクサ