7.5 離散選択モデルへの合理的消費者像の応用
離散選択モデルを用いた消費者需要の推定に関する先駆的な研究としてMcFadden (1974) による交通網に関する研究が挙げられる。この研究から続く離散選択モデルを用いた消費者需要の分析アプローチでは、顕示選好に関する理論的仮定を置いて分析を行っている。これらの議論では、首尾一貫性を満たす選択行動においては(実際に消費者が何を考えているかに関わらず)消費者が自身の効用が最大になる選択肢を選んでいるとみなせることを学んだ。これを活用し、「AとBという任意の2つの選択肢があり、ある個人がAを選んだ場合、その個人のAに対する効用はBに対する効用よりも高い」という、顕示選好に関する仮定に基づき考えることとする。
ここで、ある個人 \(i\) が選択肢 A と B の中から Aを選んだ、という状況を考える。選択肢 A の効用を \(U_{iA}\)、B の効用を \(U_{iB}\) とすると、\(U_{iA}>U_{iB}\) という関係として表現することができる。消費者の離散選択モデルでは選択肢に関する観察可能な特徴(説明変数)と観察できない要素(誤差項)を使って、選択肢 \(j\) に対する効用を以下のように定式化する18。 \[ U_{ij}=\beta_{0}+\beta_{1}x_{ij}+e_{ij} \]
このとき、\(x_{ij}\) は個人 \(i\)が直面する選択肢 \(j\)についての説明変数、\(e_{ij}\) は効用のランダム項を表している。例えば、\(x_{ij}\)が製品の価格である場合、\(\beta_{1}\) は負の値を取ると考えられるが、それだけで消費者の効用を説明できず、確率的に変動するかもしれない。そのような確率的に変動する誤差を \(e_{ij}\) というランダム項で捉えていると考えられる。このように離散選択モデルは、顕示選好の仮定と観察可能な選択結果によって、データに含まれる個人の選好・効用について類推するアプローチである。
ここで改めて、ある個人 \(i\) が選択肢 A と B の中から Aを選んだという状況について考える。誤差項を含むモデルを用いると、\(U_{iA}>U_{iB}\) という関係を以下のようなランダム項に関する式に変換することができる。 \[ U_{iA}>U_{iB}\\ \beta_0+\beta_1x_{iA}+e_{iA}>\beta_0+\beta_1x_{iB}+e_{iB}\\ e_{iB}-e_{iA}<(\beta_0+\beta_1x_{iA})-(\beta_0+\beta_1x_{iB})\\ e_{iB}-e_{iA}<\beta_1(x_{iA}-x_{iB}) \] ここで、効用のランダム項の差(\(e_{iB}-e_{iA}=e_i\))が標準正規分布に従うことを仮定すると、以下のように表すことができる (Adams, 2021)。 \[\begin{equation} P(y_i=A|x_{iA},x_{iB})=P(e_{iB}-e_{iA}<\beta_1(x_{iA}-x_{iB}))\\ = P(e_i<\beta_1(x_{iA}-x_{iB}))\\ =\Phi(\beta_1(x_{iA}-x_{iB})) \tag{7.6} \end{equation}\]
つまりこれは、\(P(y_i=A|x_{iA},x_{iB})\) という選択確率に関する回帰モデル\(\beta_1(x_{iA}-x_{iB})\) を標準正規分布の累積分布関数(\(\Phi\))で表現したものであるとみなすことができる。
さらに、このモデルは選択肢のいずれかを選ぶ合理的行動を捉えているため、何も選ばない個人がいないとすれば、製品Bの選択確率は以下のように表現される。
\[ P(y_i=B|x_{iA},x_{iB})= P(U_{iA}<U_{iB})=1-\Phi(\beta_1(x_{iA}-x_{iB})) \]
このように、個人の選択結果を捉えた理論モデル(\(U_{iA}>U_{iB}\))と整合的な形でプロビットモデルを定式化できることが示された。ここまでの内容で学んだ理論的議論にプロビットモデルを応用することによって、本来観察できない個人の選択肢に対する効用を類推する方法が離散選択モデルという分析アプローチである。
なお、上記のモデルでは、定数項のパラメータが消される形で定式化されていた。しかしながら、選択肢ごとに異なるブランド価値があると想定するモデルを構築することで、定数項を含むモデルとして定式化することも可能である。具体的には、選択肢ごとに固有の定数項(\(\beta_{0j}\)、ただし \(j = A, B\))用いて、以下のような効用関数を想定する。
\[ U_{ij}=\beta_{0j}+\beta_{1}x_{ij}+e_{ij} \]
これを、式 (7.6)と同様の定式化を行うことで、以下を得る。 \[ \begin{align} P(y_i=A|x_{iA},x_{iB})&=P(e_{iB}-e_{iA}<(\beta_{0A}-\beta_{0B})+\beta_1(x_{iA}-x_{iB}))\\ &= P(e_i<\tilde{\beta}_{0}+\beta_1(x_{iA}-x_{iB}))\\ &=\Phi(\tilde{\beta}_{0}+\beta_1(x_{iA}-x_{iB})) \end{align} \] ただし、\(\tilde{\beta}_0\)は、\(\beta_{0A}-\beta_{0B}\) であり、選択肢間の定数項の差を表している。そのため、このような定式化によって分析されるモデルの定数項は、「選択肢固有の定数項の差」として推定される。これは、選択肢に対するマーケティング戦略変数(説明変数)以外の平均的な影響として理解できる。そのため、このような効用モデルの定数項を、その選択肢がそもそも持っている相対的価値として、製品の「ベースライン価値」や「ブランド価値」として解釈することがある(照井・佐藤, 2022)。通常は、どちらか一方の選択肢の定数項を基準にし(0とおく)、そこからの差を捉える形で分析する事が多い。
以下では、前節でも用いた choice_df を用いて上記の消費者の離散選択モデルを推定する。具体的には、製品1と2の価格差(p_ratio=p1-p2)と製品1のクーポン広告受取り有無(a1)と製品2のクーポン広告(a2)を用いて以下のようなモデルを分析する。
\[
U_{1i}=\tilde{\beta}_{0}-\beta_1(p_1-p_2)+\beta_2a_1-\beta_3a_2+e_{1i}
\]
ただし、R上のコードでは、\(a_2\) の係数について、負に推定されることを想定しつつ、+ 記号を使って定式化する。
library(dplyr)
#価格差変数作成
choice_df <- choice_df %>%
mutate(p_ratio = p1 -p2)
probit2 <- glm(y1 ~ p_ratio + a1 + a2,
family = binomial(link = probit),
data = choice_df)
summary(probit2)##
## Call:
## glm(formula = y1 ~ p_ratio + a1 + a2, family = binomial(link = probit),
## data = choice_df)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.54634 0.07756 -7.044 1.87e-12 ***
## p_ratio -0.22180 0.01524 -14.559 < 2e-16 ***
## a1 0.66314 0.09162 7.238 4.55e-13 ***
## a2 -0.32291 0.09884 -3.267 0.00109 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1384.5 on 999 degrees of freedom
## Residual deviance: 1066.9 on 996 degrees of freedom
## AIC: 1074.9
##
## Number of Fisher Scoring iterations: 4
分析の結果、価格差については負に有意であり、p1 が相対的に高いほど選択確率が下がる傾向にあることを示唆している。また、自社のクーポン(a1)は正に、他社のクーポン(a2)は負に有意であることも伺えた。加えて、定数項((Intercept))は負に有意であるため、製品2を基準(製品2の定数項を 0 )とした場合と比べ、製品 1 の定数項(ブランド価値)は低いと解釈する事ができる。本モデルの解釈を行うために、限界効果と擬似決定係数を以下のように分析する。
## McFadden
## 0.229384
## Call:
## probitmfx(formula = y1 ~ p_ratio + a1 + a2, data = choice_df,
## atmean = FALSE)
##
## Marginal Effects:
## dF/dx Std. Err. z P>|z|
## p_ratio -0.0669199 0.0029405 -22.7581 < 2.2e-16 ***
## a1 0.2036848 0.0270475 7.5306 5.049e-14 ***
## a2 -0.0969891 0.0291848 -3.3233 0.0008897 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## dF/dx is for discrete change for the following variables:
##
## [1] "a1" "a2"
分析の結果、価格差が1単位(千円)大きくなると約 \(6.7\%\) 製品1の選択確率が下がることが伺える。一方で、製品 1 のクーポンを受け取っている消費者はそうでない消費者に比べて約 \(20\%\) 購買確率が高く、反対に他社クーポンは約 \(9.7\%\) の購買確率低下につながる。
ただし、行列の記法を使えば、同じ議論を \(x_{1ij},...,x_{kij}\)の説明変数に応用できる。↩︎