G検定カンペ用語集

自分用G検定用チートシート。

2023年10月


ディープラーニング技術を用いて、ある言語から別の言語への翻訳を行う最新の機械翻訳手法。
文脈に基づいて単語やフレーズを総合的に理解することで、正確で自然な翻訳を作成することができる。
2010年代に登場。
Google翻訳などにも利用されている。

ニューラル機械翻訳は、単語レベルで対訳文を作っているわけではないため、訳抜けや重複訳が起こることがある。
まったく誤った訳文になる場合もあり、どれだけ自然に近い翻訳ができても完璧ではない。


コンピュータに学習用の対訳データ(コーパス)を与え、統計モデルを学習させることで訳文を出力させる機械翻訳の方法。
統計的機械翻訳で質の高い翻訳を実現するためには、大量の対訳データを用意しなければならないが、学習は機械によって自動的に行われるため手間はかからない。
翻訳する言語の性質による影響も少ない。


機械翻訳において、あらかじめ言語上の特性や文法をルールとして登録しておき、ソース言語のルールとターゲット言語のルールの関係性に基づいて単語を並べ替え、それに用語辞書を組み合わせ機械的に翻訳する手法。
機械翻訳の手法として長い歴史があり、開発は数十年前から始められていた。
現在も、ソフトウェアのみで完結する機械翻訳では一般的に採用されている。


実在するデータに対して、その特徴や性質を把握する手段のひとつ。
データの平均や分散、標準偏差などを計算し分布を明らかにすることで、データの性質をわかりやすくすることを目的とする。
表やグラフが多く用いられる。
例)テストの平均点、偏差値

記述統計は、データが存在しないと分析できない。


シンボルグラウンディング問題

↑このページのトップヘ