人間では全体を把握できないような巨大なデータ群のこと。
明確な定義は存在しない。
一般的にはVolume(量)、Variety(多様性)、Velocity(速度あるいは頻度)の「3つのV」を高レベルで備えていることが特徴とされている。
近年では、これにVeracity(正確性)とValue(価値)を加えた「5つのV」を特徴とするとも言われる。

総務省は、ビッグデータの構成要素を、
・国や地方公共団体が提供する「オープンデータ」
・企業が保有するパーソナルデータ以外の幅広いノウハウなどのデータとM2M (Machine to Machine)と呼ばれる産業用機械の機器間通信時のデータで構成される「産業データ」
・個人の属性情報や移動・行動・購買履歴などの個人情報を含む「パーソナルデータ」
の3つに大きく分類している。(平成29年版 情報通信白書)

ビッグデータを取り巻く課題の範囲は、情報の収集、取捨選択、保管、検索、共有、転送、解析、可視化など多岐にわたる。
これらの課題を克服しビッグデータの傾向をつかむことで「ビジネスに使える発見、疾病予防、犯罪防止、リアルタイムの道路交通状況判断」に繋げられる可能性がある。

用語自体は一般的にデータマイニングで使われてきたが、2010年代に入ってある種のトレンドを示すキーワードとして、新聞・雑誌などでも広く取り上げられるようになってきた。
ビッグデータに代わりAIが流行すると、マスメディアでセンセーショナルに取り上げられることは無くなった。