G検定カンペ用語集

自分用G検定用チートシート。

2022年06月


人間では全体を把握できないような巨大なデータ群のこと。
明確な定義は存在しない。
一般的にはVolume(量)、Variety(多様性)、Velocity(速度あるいは頻度)の「3つのV」を高レベルで備えていることが特徴とされている。
近年では、これにVeracity(正確性)とValue(価値)を加えた「5つのV」を特徴とするとも言われる。

総務省は、ビッグデータの構成要素を、
・国や地方公共団体が提供する「オープンデータ」
・企業が保有するパーソナルデータ以外の幅広いノウハウなどのデータとM2M (Machine to Machine)と呼ばれる産業用機械の機器間通信時のデータで構成される「産業データ」
・個人の属性情報や移動・行動・購買履歴などの個人情報を含む「パーソナルデータ」
の3つに大きく分類している。(平成29年版 情報通信白書)

ビッグデータを取り巻く課題の範囲は、情報の収集、取捨選択、保管、検索、共有、転送、解析、可視化など多岐にわたる。
これらの課題を克服しビッグデータの傾向をつかむことで「ビジネスに使える発見、疾病予防、犯罪防止、リアルタイムの道路交通状況判断」に繋げられる可能性がある。

用語自体は一般的にデータマイニングで使われてきたが、2010年代に入ってある種のトレンドを示すキーワードとして、新聞・雑誌などでも広く取り上げられるようになってきた。
ビッグデータに代わりAIが流行すると、マスメディアでセンセーショナルに取り上げられることは無くなった。


第三次AIブームは、ビッグデータの活用が盛んになり始めた2000年以降に到来した。
これまでのルールベースAIとは異なる、自ら知識を獲得する機械学習を中心とした技術が使われるようになった。
特に、特徴表現を自動的に抽出するディープラーニングの成果が、ブームを過熱させた。

2010年ごろから本格的なブームとなった背景には、以下の要因がある。
●2000年以降のインターネットの普及によって、学習データを集めやすくなった。
GPUなど演算リソースの性能が向上し、膨大な情報を短時間で処理できるようになった。
●効果的なアルゴリズムが開発された。
●クラウド技術を使用したサービスが普及した。




日本の国立情報学研究所(大学共同利用機関法人 情報・システム研究機構)が中心となって2011年から行われている人工知能プロジェクト。
2016年までは「ロボットは東大に入れるか」をテーマに研究・開発が進められた。

「東ロボくん」と一言で言っても、その実態は社会・国語・英語・物理・数学という5教科8科目の試験問題の各問で「最も確からしい」答案を書くために多数のプロジェクト参加者によって開発された様々なアルゴリズムの総称である。

2015年6月の進研模試で偏差値57.8をマークするところまで成績を上げたが、東大合格に必要な読解力に問題があり、ビッグデータと深層学習を利用した統計的学習という現在のAI理論ではこれ以上の成績向上は不可能である、何らかのブレイクスルーがない限りは東大合格は不可能と判断され、開発は凍結された。

東大合格を目指すための学習は2016年で終了したものの、個々の開発者による個々のアルゴリズムの開発は継続しており、東ロボくんプロジェクトで得られた成果はその後のAI開発や教育政策に役立てられている。

東ロボくんの開発の過程で、現在のAIは検索による膨大な知識はあっても文章の読解力が致命的にない、AIは意味を理解できない「知識に比べ幼稚な知性」であるという、現在のAIの課題が明らかになった。

また東ロボくんは自分で答案を書けないため、東ロボくんの代わりにボールペンで答案用紙に記入したり、答案を書き終わった後に先生に挙手して答案を裏返したりするロボットアーム「東ロボ手くん」がデンソーによって開発されたことも、東ロボくんプロジェクトの成果である。


DeepMindの囲碁ソフトウェアAlphaGoのバージョンのひとつ。
2017年10月発表された。
人間の対局データを使わず、完全自己対局で学習する。
AlphaGo Zero以前の全てのバージョンよりも強い。

DeepMindの共同創立者でCEOのデミス・ハサビスは、AlphaGo Zeroはもはや「人間の知識の限界によって制約されなかった」ため非常に強力だ、と述べた。



略称MCTS。モンテカルロ法を使った木の探索のことである。
決定過程に対する、ヒューリスティクス(途中で不要な探索をやめ、ある程度の高確率で良い手を導ける)な探索アルゴリズム。

モンテカルロ木検索は、主に囲碁・チェス・将棋などのゲームの次の着手の決定などに使用される。
また、リアルタイムPCゲームや、大富豪、ポーカーなどの相手の手の内が全て分かるわけではないゲームへも使用される。

↑このページのトップヘ