フレーム問題を知る

ディープラーニングでは、「データは多いほどよい」というのはある意味事実です。気象予報士であれば、地球上のあらゆる雲のデータ、雨のデータ、風力、湿度、温度などが関係する、と考えるかもしれません。それらがまったく無関係のデータとは言い切れないからです。しかし、明日の都内の一地域の天気を予報するのに、南米チリの気象データまで必要でしょうか。しかも、チリといっても、チリのどこで取ったデータなのか、データを取る場所が1m違っても温度は違うかもしれません。そうすると、地球上のすべての場所(海上も含め)に温度センサーを設置しなければいけなくなり、地表付近だけでなく、高度1万メートルくらいまでも考えなければいけない、と果てしない話になってしまいます。しかも、温度の場合、単純に25℃といっても、小数点以下のデータもあるわけです。そうすると“初期値鋭敏性”の問題が出てきて、最後の下2桁、たとえば25.2215℃の最後の「15」 がとても重要だ、といった話も出てきてしまいます。もし、それらのデータをすべて取れるとしても、今度は無限大に近いデータをコンビュータに入力し続けることになり、それではどれだけ高速なGPUとCPU、大容量メモリを積んだスーパーコンビュータを用意しても、計算が終わらず、結果が出せないことになります。少なくとも、翌日の天気予報には間に合わないでしょう。そうすると、実時間では永遠に終わりません。したがって、どこかでデータを切らないといけない。これが「フレーム問題」と呼ばれているものです。

あわせて読みたい