投稿者「starpentagon」のアーカイブ

【統計検定1級過去問】2018年(統計数理)大問2 解答例

コメント 大学入試でもテーマになる「非復元抽出」が題材です。問1は素直に 場合の数を数え上げる ことで求められます。大学受験から時間の経っていない人には簡単だったと思いますが、「各試行は独立でないから[math]i-1[… 続きを読む »


【統計検定1級過去問】2018年(統計数理)大問2

2018年 統計検定1級(統計数理)大問2 箱の中に[math]N(\geq 2)[/math]個の球があり赤玉が[math]M[/math]個、青玉が[math]N-M[/math]個入っている。この箱から非復元抽出で… 続きを読む »


【統計検定2級】2018年11月過去問 解答例

2018年11月開催分の解答例です。 例年通り確率変数の計算、仮説検定を中心とした出題でした。ただ、単なる知識を問うだけではなく、きちんと理解できているかが問われている問題が目立ちました(問11, 18など)。 教科書の… 続きを読む »


Kaggle Titanicチュートリアル: ベースラインモデル編

いよいよ機械学習モデル構築に入っていきます。高度なモデルを使いたくなりますが 仮定、前提が多く「うまく動かない」「精度がでない」ことがある エラーや精度が出ない時の原因特定が大変 なのでシンプルなモデルから始めて徐々に高… 続きを読む »


Kaggle Titanicチュートリアル: クロス集計(後半)編

引き続き特徴量と生存率の関係を見ていきます。前半編でも触れたように 特徴量の変化によって生存率に差がでるか? 特徴量の変化に対して生存率が上下したり非単調な変化をしていないか? を確認します。なお、Jupyter not… 続きを読む »


Kaggle Titanicチュートリアル: クロス集計(前半)編

さぁここから年齢、性別などの特徴量と生存率の関係を見ていきます。基本的には 特徴量の変化によって生存率に差がでるか? 特徴量の変化に対して生存率が上下したり非単調な変化をしていないか? を確認します。特徴量生成の重要ポイ… 続きを読む »


Kaggle Titanicチュートリアル: 基礎集計編

続いて学習/評価データの基礎集計をしていきます。基礎集計では 異常値(定義上、ありえない値)がないか 分布の確認 外れ値がないか 頻度の少ないデータがないか 学習、評価データで分布に偏りがないか を確認し、適切な前処理を… 続きを読む »


Kaggle Titanicチュートリアル: データ確認編

データ分析と聞くと機械学習アルゴリズムを使ったモデル構築に目がいきますが、 どのアルゴリズムが使えそうか アルゴリズムに適した形にデータ整形 するには分析対象のデータの内容をきちんと理解しておくことが重要です。そこで、分… 続きを読む »


Kaggle Titanicチュートリアル: 環境構築編

ここでは分析を始めるために必要な 学習/評価データのダウンロード 分析環境準備 について説明します。 学習/評価データのダウンロード 「Data」のページに行くと データ定義と説明 学習/評価データと予測結果のサンプル … 続きを読む »


Kaggle Titanicチュートリアル: 準備編

ここではKaggle Titanicチュートリアルを始めるにあたって必要な Kaggleアカウントの作成/サインイン Titanicチュートリアルの内容/ルール確認 について説明します。 Kaggleのアカウント作成/サ… 続きを読む »