7.7 需要の予測と本章のまとめ

ここまでは、離散選択モデルを用いて消費者の選択に関わるパラメータを推定する方法について紹介してきた。これを用いることで、モデルに基づく各選択肢の選択確率を計算することが可能になる。例えば以下では、先ほど推定した2項選択モデルである probit2 を用いて、推定結果から選択確率の予測値を計算する。

#パラメータの推定値(beta)の抽出
beta <- probit2$coefficients
#パラメータ betaと説明変数の線形結合を作成(beta_0は定数項なので1をかける)
est_probit2 <- cbind(1, choice_df$p_ratio, choice_df$a1, 
                      choice_df$a2) %*% beta
  
#pnormによって標準正規分布の分布関数による計算を実行する。
#製品1(c1) を選ぶ確率の予測値
pred_probit_c1 <- pnorm(est_probit2)
mean(pred_probit_c1)
## [1] 0.4789384
#ロジットモデルの場合
logit2 <- glm(y1 ~ p_ratio + a1 + a2, 
               family = binomial(link = logit),
               data = choice_df)
beta_logit <- logit2$coefficients
est_logit2 <- cbind(1, choice_df$p_ratio, choice_df$a1, 
                      choice_df$a2) %*% beta_logit
pred_logit_c1 <- (exp(est_logit2))/(1+exp(est_logit2))
mean(pred_logit_c1)
## [1] 0.479

probit2 モデルにおける製品1の選択確率は約 \(47.9\%\) であり、製品2とほぼ半分ずつ分け合っているが、わずかに製品2の選択確率のほうが高いことが伺える。ここで、製品1の企業が値下げを行ったら、選択確率はどの様に変化するのだろうか。このような架空の状況について、今回の分析結果(パラメータの推定値)を用いて予測してみる。choice_df における p1 の平均はおよそ10(千円)である。仮に、製品2の価格を変えず、製品1の価格を平均価格の \(10\%\) (1000円)値引き(\(p1-1\))した場合の価格差を考える。

choice_df_v <- choice_df %>% 
  mutate(p1_v = p1 - 1,
         p_ratio_v = p1_v - p2)
est_probit_v <- cbind(1, choice_df_v$p_ratio_v, choice_df_v$a1, 
                      choice_df_v$a2) %*% beta

#pnormによって標準正規分布の分布関数による計算を実行する。
#製品1(c1) を選ぶ確率の予測値
pred_probit_v <- pnorm(est_probit_v)
mean(pred_probit_v)
## [1] 0.5459071

分析の結果、1000円の値下げによって企業1は製品の選択確率を約\(54.6\%\)まで上昇することが示された。この値下げ幅によって生じる損失や費用と、上昇する選択確率による便益をどう捉えるのか、そしてどのような意思決定を行うのかは、企業の意思決定者に委ねられるべき問題である。しかしながら、既存の消費者行動データをきちんと蓄積、分析することで、実際に値下げを実行しなくても消費者の選択がどう変わりうるかを予測できることは実務的にも非常に有効な手段であるだろう。

離散選択モデルは、プロビットモデルやロジットモデルを実行するための関数を用いて分析が可能である。しかしながら、引数の設定や出力される結果の解釈、ひいてはモデルそのものに内包されている理論的仮定について最低限の理論的知識が必要になる。そのため、本章では理論に関する説明も含め離散選択モデルについての紹介を行った。

離散選択モデルには、ここで紹介した以外にも様々なタイプが存在する。たとえば、被説明変数が離散的であり大小関係を持つような変数(ランキング、アンケート尺度など)の場合、順序プロビット(Ordered probit)や順序ロジットモデルを用いることが多い。また、被説明変数が打ち切りデータである場合、トービットモデルを用いる。打ち切りデータとは、データの上限や下限があるようなデータであり、例えば株の保有額は保有していなければ 0(下限)で保有している際はその評価額をとるため、打ち切りデータだと考えられる。また、打ち切りデータであり、 0 の観測が著しく多い被説明変数の場合には、ポアソンモデルや負の二項分布モデルが用いられる。例えば、ある製品の購買頻度や購買量について(アンケートなどを用いて)広く消費者から情報を得る場合など、多くの消費者においては購買頻度が 0 であると考えられる。このようなデータを被説明変数とする場合にはポアソン分布や負の二項分布を想定したモデルを利用することが多い。紙幅の都合上これらの詳細は割愛するが、関心のある読者は計量経済学やマーケティング・サイエンスのテキストを参照してほしい。

また、本章の前半に紹介した通り、このアプローチは「自身の好みを理解し、首尾一貫した選択を行う」ような消費者像を前提としている。この前提は多くの状況に当てはまるものだと思われるが、そうではない状況もあるだろう。ここで想定している前提が崩れるような状況や個人的特性に着目する場合、異なる世界観(理論や学術領域)に基づく研究が必要になる。そのため、自身の捉えている問いや状況がどのようなものであるかを明確化し、それに整合的な理論と手法を選んで研究を進めることが重要になる。