予測時には入手できない情報を、入力の一部としてモデルの構築に利用した際に発生する問題。
時系列データを扱うタスクにおいて、学習用データと検証用データが時間で分割され、将来の予測が求められる場合、リークが発生しやすい。

時系列データの場合、時間的な情報を考慮せずに特徴量の作成やデータ分割を行ってしまうと、本来より不当に高い精度が出てしまい、実運用の際には制度が低下してしまうといったことが起こる。
リークを防ぐにはデータの分割に注意する。