本書では金融におけるデータ分析がビッグデータ/AIの発展でどのように進化したかを紹介しています。金融系のお客様と仕事する機会があり読んだのですが最近の動向、ネタを仕入れるのに適した本だと思います。
まず金融データの変化、拡大を概観した後に活用事例が紹介されています。テーマは
- 企業間の取引関係をネットワーク構造化し、その情報をもとに株価予測
- CSRレポートをESGの観点から可視化、取り組み評価
- 決算短信のテキストマイニングによる企業評価
- FEDウォッチャーのAI化
とテーマ自体はこれまでにもあった話ですが分析アプローチが目新しいです。たとえばCSRレポートの分析ではレポート中の単語をツリー構造化し可視化していますが
- 単語間の関連性はword2vecで定義
- 単語ツリーを単語間の距離が最小になるように配置。上下関係は頻度で定義
とword2vecを使っていたり、決算短信の
- 業績要因文からDeep Learningモデルで極性判定(ポジネガ判定)
- 経営環境文をスピンモデルを使い「不自然さ」を定量化
したりと随所に最近話題になった手法が組み込まれています。
分析結果も
企業間ネットワーク
- カスタマー企業のニュースがサプライヤー企業の将来の株価変化を予測できる可能性がある
- 規模が小さく、カスタマー企業が多いほど株価に織り込まれるまでの時間が長い
決算短信のテキストマイニング
- 業績要因文の極性判定が将来の売上達成率と関連あり
- 経営環境文の不自然さを定量化し評価精度を向上
FEDウォッチャー
- FOMC議事録の極性を判断した結果と非農業雇用者数との連動を確認
とここまでできるようになったのかと思う結果が紹介されています。本書では結果をさらりと示していますが、この結果にいたるまで「何と何との関連性を評価するのか」の試行錯誤を含めて背後には膨大な分析がされていると思います。
興味深い分析アプローチと気合の入った分析結果が示されていますが、本書中では
- 分析アプローチの概要を中心に解説
- 分析の詳細(前処理の詳細やDeep Learningモデルのネットワーク構造など)は触れられていない
そこは参考文献に当たる必要があると思います。
実際にデータ活用した事例を中心に解説しており、
- 金融業界でAI活用を考えている方
- 分析を仕事にしている人
が金融におけるデータ分析の最新の動向を知るのに適した一冊だと思います。