技術ノート 特徴 Shazam のような音楽識別アプリはどのように機能しますか?

Shazam のような音楽識別アプリはどのように機能しますか?

音楽識別アプリは一見魔法のように見えますが、内部には瞬時に曲を見つけることができる高度な アルゴリズム が組み込まれています。仕組みは次のとおりです。

音楽識別の魔法

おそらくそれは私たち全員に起こったことでしょう。素敵なレストランでディナーをしたり、コーヒーショップでくつろいだり、店内を歩き回ったりしていると、突然スピーカーから素晴らしい曲が流れてくるのが聞こえます。たぶんそれはあなたが以前に聞いたことがある曲、または聞いたことのないトラックかもしれません。そこで、携帯電話を取り出し、Shazam を開き、デバイスを天井にかざします。アプリは、その曲が何であるか、アーティストが誰であるか、どこでストリーミングするかを瞬時に教えてくれます。

彼らは素早く、驚くほど正確で、最もあいまいな曲さえも識別できます。簡単に言うと、録音から曲を分離し、膨大なトラック データベースと照合して検索します。しかし、これを実現する背後にあるテクノロジーは非常に複雑で印象的です。

今日私たちが知っている Shazam アプリが 2002 年にリリースされたことを知ったらショックを受けるかもしれませんが、システムは当時も現在と同じくらい正確で高速でした。それはすべて、音楽の世界に革命を起こす独自のアルゴリズムのおかげです。

Shazam のような音楽識別アプリはどのように機能しますか?

歌詞だけじゃない

一見すると、Shazam のような音楽識別アプリは単純に見えるかもしれません。他の音声アシスタントと同じように、歌詞を聞いて のデータベースを検索して、その曲が何であるかを教えてくれるだけだと思う​​かもしれません。

ただし、ほとんどの音楽識別アプリは、インストゥルメンタルのタイトルや、カバー ソングの歌手さえも知ることができます。それは、トラックの歌詞を分析するのではなく、広範なデータベースから各曲に固有の「指紋」を探しているからです。

Shazam のような音楽識別アプリはどのように機能しますか?

フィンガープリンティング技術

おそらく、指紋を使用してロックを解除できるデバイスをお持ちでしょう。指紋とは、あなたに固有の指の小さな線の配置です。同様に、マイクを構えて曲の短いクリップを録音すると、このクリップは Shazam や他のアプリがデータベースで検索できるデータのパターンに変換されます。

一見すると、この方法にはいくつかの問題が発生しやすいように思えます。公共の場で音楽を聴くときは、ほとんどの場合、スピーカーから発生するバックグラウンド ノイズや歪みがあり、曲が識別できなくなったり、不正確な一致が生じたりすることがあります。また、短いサウンド クリップでも大量のデータがキャプチャされるため、数百万曲のデータベース全体でこれらのパターンを検索するのが遅くなる可能性があります。

Shazam の共同創設者でチーフ データ サイエンティストである Avery Li-Chun Wang は、2003 年の Scientific American のインタビューで、同社のアルゴリズムがこれらの問題をどのように解決するかを説明しています。オーディオ クリップの情報は、一定期間にわたる周波数の変化を表すスペクトログラムとして知られる 3D チャートで視覚化できます。また、音の大きさを示す振幅も考慮されます。これは、色の強度を使用してスペクトログラムで表されます。

人間が特定の周波数になければ音を知覚できないのと同じように、Shazam は検索を実行するときに曲全体を考慮するのではなく、オーディオ クリップ内の最も高いエネルギー成分である「ピーク」のみを考慮します。 。キャプチャされたフィンガープリントは、特定の時間フレーム内の最高周波数ポイントのみを取り込み、次にそれらの周波数内のピーク振幅スポットを取り込みます。

コロンビア大学 の研究論文の中で、Wang 氏は、この方法によりバックグラウンド ノイズなどのオーディオ クリップの不必要な部分のほとんどを取り除き、歪みを取り除くことができると述べています。また、プリントのサイズが十分に小さくなるため、膨大なデータベースの中から曲を特定するのにわずか数ミリ秒しかかかりません。

Shazam のような音楽識別アプリはどのように機能しますか?

シャザムの影響

音楽識別アプリは、好きな曲を聴く平均的なリスナーにとって役立つだけでなく、音楽の世界を形作るのにも役立ちます。

ラジオ局や ストリーミング サービスは 、一般の人々がどの曲を聴いているかを把握するために、どの人々が最も Shazam を行っているかに関するデータをよく使用します。これは、アーティストに関係なく、曲のキャッチーさと潜在的な人気を示すため役立ちます。アプリで曲を特定すると、何人がその曲を特定しようとしたのかがすぐにわかります。

Shazam の台頭以来​​、少数の競合他社も現れました。 Soundhound は、歌ったりハミングしたりするだけでその曲を識別できると主張していますが、結果はまちまちです。 Shazam のシステムと非常によく似た Google アシスタント などの音声アプリに統合された曲識別子もあります。

「 Shazam のような音楽識別アプリはどのように機能しますか?」に関するベスト動画選定!

曲名や歌手名を瞬時に教えてくれる神アプリ!『Shazam』- iPhone, Android対応
【分からない曲を簡単に知る方法があるんです!】スマホのアプリ「Shazam」がめちゃくちゃ便利。タナカズルーム。