2023年02月16日 データリーク 予測時には入手できない情報を、入力の一部としてモデルの構築に利用した際に発生する問題。時系列データを扱うタスクにおいて、学習用データと検証用データが時間で分割され、将来の予測が求められる場合、リークが発生しやすい。時系列データの場合、時間的な情報を考慮せずに特徴量の作成やデータ分割を行ってしまうと、本来より不当に高い精度が出てしまい、実運用の際には制度が低下してしまうといったことが起こる。リークを防ぐにはデータの分割に注意する。 「G検定カンペ用語集」カテゴリの最新記事 タグ :#G検定#カンペ < 前の記事次の記事 >