法律コンビニ!街の法律家として皆様のお役に立ちたい。

行政書士とデータサイエンティスト22

行政書士とデータサイエンティスト22
 エクセルは気軽にデータをの分析を行うことのできるソフトウェアであり、最近では大きなサイズの表も扱えるようになった。しかし、エクセルに向いてない処理もある。例えば、動作の再現がしにくい。

 データの整合性を保つ機能ソフトウェアが関係データベースである。商用では、Oracle、IBMDB2、オープンソースでMySQLなどがある。

 データベースを操作する言語がSQLである。SQLを習得すれば、さまざまなデータベースを扱うことができる。最近では、NoSQLというデータベースを用いて、関係データベース以外のデータベースを扱うことができる。

 データから予測モデルを構成するには、統計的なモデルリングが必要とされる。よく利用されるモデルや分析法は
①品質を他の変数から予測あるいは説明する回帰分析
②食品が良品か不良品を判断する判別分析
③似た個体をまとめてデータをいくつかの群に分けるクラスター分析などがある。

 回帰分析において説明変数の線形関数を用いる「線形モデル」が一般的であるが、説明変数の領域を順次区間に分けていく方法を「決定木」モデルという、神経情報伝達を模した関数を用いる方法を「ニュートラルワーク」という。

2022/5/14