概要
データ解析コンペティション特集号でH19年度のコンペで上位入賞になった方の手法が発表されています。
題材となったデータはシステム・ロケーション社提供の自動車オークションデータでオークション情報、出品者情報、車両情報、落札情報などが含まれています。このコンペの特徴は特にテーマが設定されておらず課題設定力も問われるところです。実際、掲載されている論文も
- 落札額の推定
- 自動車リース査定条件の分析
- 購入後の使用目的別クラスの探索
- 入札支援を行うフレームワークの検討
とテーマも多岐にわたっています。
この号が出たのがちょうど社会人1年目だったことや、入札支援を行うフレームワークの検討をした論文の筆頭著者(桑田さん)が私の教育係だったこともあり当時を振り返りながら印象に残った3論文の概要を紹介したいと思います。
多量の入札履歴からの落札額分布推定(関 庸一, 阿左美 尚志)
著者はコンペで一般の部で最優秀賞を獲得した関先生, 阿左美先生です。車両情報と落札情報が与えられれば落札額の推定は誰でも思いつくテーマで、テーマにひねりがない分うまく分析しないといけませんが見事、最優秀賞に輝きました。
関先生らは落札額分布を
- 入札額が二重指数分布に従うと仮定
- 落札額分布を極値回帰モデルで推定
としたのがポイントで、コンペに参加していた桑田さんが
関先生らの極値回帰を使った構想がすばらしかった。あれにはさすがに勝てない。
と語っていたのが印象的でした。他チームがテーマ設定にひねりを加えてポイントを稼ぎにくるなか分析設計で勝ちきったのはすごいと思います。
中古車オークションデータを用いた自動車リースの査定条件に関する分析
一般部門で優秀賞に輝いた中原先生らの論文です。自動車リースにおける
- リース条件の設定
- 残存価値の推定
をテーマに設定し関先生とは対照的にテーマ設定のうまさが光る内容だと思います。
論文では法人向け自動車リース市場は確立されている一方で個人向け自動車リースは発展途上であることを踏まえ
- 残価に重大な影響を与える要因の抽出
- 原状回復した場合の落札額の推定
- リース金利と残価の設定の支援
を分析されています。
実際にパターン分析、協調フィルタリングを工夫して適用し落札金額に重大な影響を与える条件を発見し、それらの条件を原状回復した場合の落札金額の推定方法を提案されています。さらに車両の種類、経過年数で分類した「戦略マップ」を作成しオートリース資金運用支援システムを提案されています。
最小絶対値回帰分析を利用した中古車落札金額予測モデルの構築
学生部門の最優秀賞を受賞された高野先生らの論文です。関先生らと同じく落札額の推定をテーマにしていますが、
- 説明変数の選択と回帰分析を同時に実行
- Conditional Value-at-Riskを利用
することで予測を大きく外すリスクを回避したモデルを提案しています。
回帰分析を最適化問題として定式化して
- 変数選択
- 上ブレ/下ブレ抑制
などの種々の要件を制約として実装するアプローチは業務要件を柔軟にモデルに組み込む方法の一つだと思います。最近は説明変数の選択は正則化モデルのチューニングで済ませることが多いですが、こういった手法の有用性が広く認知されるようになるといいですね。