Excelでデータ表記の揺れ・ミスを調べる方法。(ピボットテーブル・Power Query)

Excel

Excelでデータを扱うとき、表記の揺れや入力ミスがあると別データと判断します。

ただ、集計する、分析するということを踏まえると、データを整えておく必要があります。
その見つけ方をお伝えします。

同じ文字でもデータは別の扱い

 

データを使って集計をしたり、分析をするときにはデータを整えておく必要があります。

ただ、Excelに入力されたデータだと、表記が統一されていなかったり、パッと見て気づかない表記の揺れもあります。

 

たとえば、このデータ1つ目のiPadと2つ目のiPad。スペルは同じなのですが、半角と全角で違うため別データになります。

GOforIT

 

1つ目のiPadと3つ目のiPadは半角ですし、スペルもまったく同じです。ただ、3つ目のiPadは実は後ろにスペースが入っているのです。

 

これはご覧のとおり、シートを見ていても気づけません。
ただ、Excelではこれも別のデータとして扱われます。

 

データが少なければともかく、データ数が多い場合にもサッと表記の揺れやミスを見つけたいものです。

集計や分析をするなら事前にデータを整えておく必要があります。
データに揺れがないのが理想ですが、他の方がデータを入力している場合など、そうもいかないこともありますので。

データ数が少なければオートフィルタで探すというのも手ですが、今回はそれ以外の方法を紹介します。

 

ピボットテーブルで調べる

 

データ表記の揺れを見つける方法の1つはピボットテーブルを使うことです。

売上を商品別、月別に集計するならピボットテーブル SUMIFSよりも自由でかんたん – GO for IT 〜 税理士 植村 豪 Official Blog

いまあるデータをCtri+Tでテーブルにして、

GOforIT

Excelの「テーブル」は超スグレモノ 見やすさ、使いやすさ100点の表に一瞬で変わる! – GO for IT 〜 税理士 植村 豪 Official Blog

「挿入」タブ→「ピボットテーブル」→「テーブルまたは範囲から」と選び、

 

ピボットテーブルで行列を指定すると、
GOforIT

 

半角と全角の違いがあるとわかります。さらにデータが10月〜12月だけなのになぜか6月がでているというのも。集計してざっくり気づけます。

GOforIT 3

iPad Proはフォントが半角なのに、行ラベルが2つあるということは、前述したようにスペースが入っている可能性が高いです。

ピボットテーブル内の金額をダブルクリックすれば、どのデータかを特定できます。
GOforIT

置き換えでデータを統一しましょう。

GOforIT

店舗別売上の集計はExcelのピボットテーブルが便利 いろんな角度からの集計が一瞬でできる – GO for IT 〜 税理士 植村 豪 Official Blog

Power Queryを使う

 

もう1つはPower Queryを使う方法。

「Power Queryてなに?」と思われるかもしれませんが、ここではExcelの機能の1つだと思っていただければ。

「データ」タブ→「テーブルまたは範囲から」をクリックすると。

Power Queryの画面が起動します。

 

で、列の品質、列の分布、列のプロファイルにチェックを入れてみると、

GOforIT 4

 

データの上にグラフのようなものが出てきます。これでデータの分布がわかります。たとえば売上金額はすべてバラバラなので、棒グラフがすべて同じ高さです。

これでデータ量が一目瞭然なのです。
たとえば、列統計のカウント「27」はデータの行数。サンプルでつくったのがバレましたわ。

GOforIT 5

日付の列をクリックすると、「最小」が1930/06/…となっています。これはあきらかにミスです。

ちなみに隣の「列分布」というのは日付ごとにデータがいくつあるかがグラフになったものです。

 

次に商品列をクリックし、列分布を見ると横の棒グラフが表示されます。端まで届いている項目はデータ表示に揺れがないとわかります。
GOforIT 6

いっぽうで、届いていないものは揺れがあるもの。iPad Proにスペースがなかったり、表記ミスがなければ棒グラフが届いていたことでしょう。

 

グラフの上で右クリックし値の置換えとすると、

GOforIT 7

 

表記の揺れを置換えすることができます。(その後、読み込みをすれば保存されます。)
GOforIT 8

 

最後に金額の列を見ると、「有効96%」「空4%」となっています。これは空白のセルがあるということです。実際に探してみると22行目に「null」と表示されていました。

GOforIT 9

データが入っていないということです。

 

ということで、データ表記の揺れやミスによるエラー値などを探す方法をまとめてみました。
いろいろな探し方があるということで参考にしていただければ。

 


【編集後記】
昨日はオンラインセミナー開催。夕方、キッチンに立って長女(14)とオムライスをつくりました。卵を割ったら双子だったので、これは「料理やれ」というお告げかもしれません。サッカーから帰ってきた長男(7)に「おとうさん、なんで料理してるの?できるの?」とかなり驚かれました。そういえば料理する姿見せたことないので。

【昨日の1日1新】
※「1日1新」→詳細はコチラ
長女(14)と一緒に料理