【技術本】Pythonではじめる教師なし学習
https://amzn.to/4kHP1aY
【技術本】Pythonではじめる教師なし学習
へポスト
教師あり学習と対比し、教師なし学習の利点や特性などを踏まえながら、以下の順で教師なし学習を紹介してくれている。
内容は、機械学習の基本知識をすでに理解している人向け。
・scikit-learnを用いた教師なし学習
次元削減:膨大な特徴量を含んだ高次元データを、関数近似などで特徴量を残しつつ低次元に変換する
・線形射影(主成分分析(PCA)、特異点分解、ランダム射影)
・多様体学習(ISOMAO、多次元尺度構成法、局所線形埋め込み、t-sne、辞書学習...)
クラスタリング:類似性に基づいて観測点をグループ分けする
・TensorFlowとkerasを用いた教師なし学習
オートエンコーダ:特徴量抽出手法の一つ
半教師あり学習:教師あり、なしの両方のメリットを組み合わせる。利用できるラベル情報を活用してデータセットの構造を明らかにして、残りのデータのラベルづけの補助ができる
・TensorFlowとkerasを用いた深層教師なし学習
RBM(制限付きボルツマンマシン)による映画推薦システムの構築
DBM(Deep Belief Network:深層信念ネットワーク)の構築:複数のRBMからなる
GAN:敵対的生成ネットワーク、DCGAN
時系列クラスタリング:一つの観測点でしかなかった横断的データ以外に、時系列データを学習できる
実際にgithubからソースコードをダウンロードして、クレジットカードのトランザクションデータを使って不正を検知する教師なし学習システムの構築演習を体験する事ができる。
機械学習における教師なし学習法についての一連の作業過程、分析手法の実例を勉強したい人に価値が出てくる著作だと感じた。
へポスト
