scikit-learn– category –
-
scikit-learn
scikit-learn k-means
教師なし学習の一つで、クラスタリング手法の一つです。非階層クラスター分析の一つに含まれます。 k-means法のフロー クラスタ数を決定し、ランダムに初期値を決定する割り振ったデータをもとに各クラスタのクラスを推定推定したクラスごとの重心を計算す... -
scikit-learn
scikit-learn t-SNE
t-SNEは、データ可視化のために、低次元空間への埋め込みに最適な非線形の次元削減手法の一つです。教師なし学習のひとつで、SNEという次元削減アルゴリズムを改良した手法です。 PCAと異なり、PCAでは表現できな非線形なデータ、かつ高次元なデータに対し... -
scikit-learn
scikit-learn 主成分分析(PCA)
主成分分析(PCA:Principal Component Analysis)は教師なし学習の一つのアルゴリズムです。主成分とは、相関のない少数で全体のばらつきを最もよく表す変数のことをいいます。PCAを行うことにより、特徴量の次元を削減することができ、データの特徴が判... -
scikit-learn
scikit-learn ランダムフォレスト
ランダムフォレストは、決定木を弱学習器とするアルゴリズム分類問題でも回帰問題でも適用可能です。決定木では、過学習に陥りやすいという課題があるため、ランダムフォレストではその決定木を複数個作成してアンサンブルすることで、この課題に対応して... -
scikit-learn
scikit-learn ロジスティック回帰
ロジスティック回帰とは、ベルヌーイ分布に従う変数の統計的回帰モデルの1つです。回帰という名前がついていますが、分類問題を解くためのモデルなので注意しましょう。 ロジスティック回帰ではシグモイド関数を使用して、確率値を算出し0, 1の分類を行い... -
scikit-learn
scikit-learn 線形回帰
xを説明変数、yを目的変数と呼びます。説明変数が1つの場合は単回帰、2つ以上の場合は重回帰と呼びます。 単回帰: $$y = w_0 + w_1 x$$ 重回帰: $$y = w_0 + w_1 x_1 + w_2 x_2 + \cdots + w_m x_m$$ LinearRegressionの使い方 【LinearRegression()の... -
scikit-learn
scikit-learn サンプルデータセット (Python)
本記事では、scikit-learnに含まれているデータセットは何があるのか、サンプルデータの使い方について解説します。 サンプルデータの種類 scikit-learnにはさまざまなデータセットが提供されており、簡単にsickit-learnのモデルに流すことができるため、s...
1