データマイニング」カテゴリーアーカイブ

Python(Pandas)でのビン分割(binning)方法

数値データを適当な境界で区切りカテゴリデータ化することをビン分割(binning)と呼びます。例えば「年齢」をざっくり「年代」としてみることで傾向が捉えやすくなるなど機械学習ではよく行われる前処理の一つです。 panda… 続きを読む »


金融データサイエンス(三菱UFJトラスト投資工学研究所 編)

実践 金融データサイエンス 隠れた構造をあぶり出す6つのアプローチ 本書では金融におけるデータ分析がビッグデータ/AIの発展でどのように進化したかを紹介しています。金融系のお客様と仕事する機会があり読んだのですが最近の動… 続きを読む »


オペレーションズ・リサーチ:平成20年度データ解析コンペティション特集号, vol.55 no.02(2010/02)

概要 データ解析コンペティション特集号でH20年度のコンペで上位入賞になった方の手法が発表されています。 題材はライフスケープマーケティング社が提供している「食MAP」データで 食卓データ: いつ(朝昼夕)どんな食材を使… 続きを読む »


オペレーションズ・リサーチ:平成19年度データ解析コンペティション特集号, vol.54 no.02(2009/02)

概要 データ解析コンペティション特集号でH19年度のコンペで上位入賞になった方の手法が発表されています。 題材となったデータはシステム・ロケーション社提供の自動車オークションデータでオークション情報、出品者情報、車両情報… 続きを読む »


CIFAR-10データセット

CIFAR-10[1]「サイファー・テン」や「シーファー・テン」と呼びます。はAlexNetで有名なAlexさんらが構築したもので80 million tiny imagesから 飛行機、犬など10クラス 学習用データ5… 続きを読む »


MNISTデータセット

MNIST[1]Modified National Institute of Standards and Technologyの略で「エムニスト」と呼びます。はDeep Learningや機械学習のチュートリアルで頻繁に… 続きを読む »


OneVsRestClassifierのチューニング方法

Pythonの機械学習ライブラリscikit-learnには2クラス分類モデルを複数用いて多クラス分類を行うOneVsRestClassifierが用意されています。 また、パラメタチューニングの仕組みとしてGridSe… 続きを読む »


GridSearchCV(scikit-learn)によるチューニング

Pythonの機械学習ライブラリscikit-learnにはモデルのパラメタをチューニングする仕組みとしてGridSearchCVが用意されています。 ここではGridSearchCVの使い方を紹介し、実行例としてsci… 続きを読む »


転移学習(神嶌 敏広 著):2. 転移学習手法

産総研 神嶌先生による転移学習(transfer learning)のサーベイ論文です。人工知能学会 AI書庫にPDFが掲載されています。さらに先生のHP(発表論文)に人工知能学会研究会での発表資料もアップされています。… 続きを読む »


転移学習(神嶌 敏広 著):1. 概念編

産総研 神嶌先生による転移学習(transfer learning)のサーベイ論文です。人工知能学会 AI書庫にPDFが掲載されています。さらに先生のHP(発表論文)に人工知能学会研究会での発表資料もアップされています。… 続きを読む »