法律コンビニ!街の法律家として皆様のお役に立ちたい。

行政書士とデータサィエンティスト

行政書士とデータサイエンス21
30年位前は事務作業は紙ベースだった。

 最近は、文書はパソコンアプリで作成し、計算はアプリでする。つまり、データが自然にデジタルで保存されるようになった。よく使用するのはエクセルである。

 ピボットテーブルで項目ごとの集計や頻度を簡単に求めることができる。エクセルのグラフの機能を使用すると、データを可視
化できる。

 データの可視化であるが、「BIツール」というアプリで地図と組み合わせてデータを可視化できるのである。データベースソフトと連携もできるのである。

 データが表形式に整理されていれば、さまざまな分析が可能になる。データを票の形式にする前の作業をデータクリーニングと呼んでいる。
具体的には
①統一のファーマットに統一する
②表記のゆれ(元号と西暦が混在している)を統一する。
③異常値やはずれ値ある場合は入力ミスは判断する。
④項目の定義の問題(産業の分類の定義問題等)などがある。


2022/5/13