データ分析シナリオの策定
1. データ分析のシナリオを策定することは、データ項目を以下の観点から整理することと考えることができます。
ある監査テーマにもとづいて、入手したデータを分析しようとする際には、まず、データ項目を 『分析指標』 と 『分析軸』 という2つの観点から整理してみます。
① 分析指標
:何の値を対象として分析するか?(例:商品販売単価、商品仕入単価、販売数量、販売金額…etc)
② 分析軸
:何を切り口として分析するか?(例:商品コード、商品属性、得意先、仕入先、営業担当者…etc)
2. 分析指標については、監査のテーマよりおのずと特定されるケースが多いと考えます。
『分析指標』 については、以下のように監査テーマが決まっている場合には、おのずと導き出されてくることが多いと思います。
なお、分析指標自体を特定する必要がある場合(※)には、以下のアプローチに基づき、不正や誤謬の兆候が、どのような形で表れてくるのかを検討します。
(※)監査テーマそのものを決めるプロセスの一環として、分析指標の特定を行うケースが多いと考えます。
3. 分析軸については、同質性の観点から情報を整理することで特定できます。
異常なデータは、他のデータと比較することであぶり出すことができます。
ここでポイントとなるのは、如何に比較を行うためのグループ(同質性を有するグループ)をつくるか、ということです。
例えば、極めてシンプルに、以下のような製品の売上実績データにおける粗利率の異常を分析するケースを考えてみます。
(粗利率の異常を識別する為の閾値として、偏差値40未満 or 偏差値60超 と仮定します。)
※偏差値を活用した分析シナリオの解説については、こちらをどうぞ!
単純に、「製品分類①」 だけを分析軸として取り上げて、粗利率の偏差値を算出(「偏差値①」:「製品分類①」 での、粗利率の平均値を計算し、算出した偏差値)してみると、異常なレコードとして、No.1、No.4、No.9、No.11 が識別されます。
しかし、実際には製品分類②③によって、高粗利の製品なのか、中粗利の製品なのか、低粗利の製品なのかといったグループ分け、つまり同質性を有するグループをつくることができます。
そこで、分析軸として製品分類①~③を取り上げて、同種のグループの中で粗利率の偏差値を算出(「偏差値②」:「製品分類①~③」の組み合わせ毎に、粗利率の平均値を計算し、算出した偏差値)してみると、No.1、No.3、No.10が異常なデータとして識別されます。
No.10は、量産品の一般品というグループの中においては、相対的に高い粗利率となっており、これが適切に識別されるようになります。
また、オーダー品の特注品というグループの中においては、相対的に低い粗利率となっている、No.3 が識別されるようになっています。
このように、如何に分析対象とする値(分析指標)が同質的なものをグルーピングするか、そのグルーピングを行う為に、どういった分析軸を活用することができるのか検討を行うことが、分析を成功させるための秘訣となります。
はじめのうちは、同質性の観点からグルーピングを行うことに戸惑いを感じるかもしれませんが、慣れてくるとデータ分析シナリオを策定する上での強力な武器になりますので、是非、実務に取り入れていくことを検討いただければと思います。