行政書士とデータサイエンス21
30年位前は事務作業は紙ベースだった。
最近は、文書はパソコンアプリで作成し、計算はアプリでする。つまり、データが自然にデジタルで保存されるようになった。よく使用するのはエクセルである。
ピボットテーブルで項目ごとの集計や頻度を簡単に求めることができる。エクセルのグラフの機能を使用すると、データを可視
化できる。
データの可視化であるが、「BIツール」というアプリで地図と組み合わせてデータを可視化できるのである。データベースソフトと連携もできるのである。
データが表形式に整理されていれば、さまざまな分析が可能になる。データを票の形式にする前の作業をデータクリーニングと呼んでいる。
具体的には
①統一のファーマットに統一する
②表記のゆれ(元号と西暦が混在している)を統一する。
③異常値やはずれ値ある場合は入力ミスは判断する。
④項目の定義の問題(産業の分類の定義問題等)などがある。
江尻 一夫行政書士事務所
福島県いわき市常磐水野谷町千代鶴68
TEL: 0246-43-4862
Copyright © 江尻 一夫行政書士事務所, All Rights Reserved.