皆様こんにちは
唐突ですが機械学習を最近勉強しておりますが非常に便利なライブラリについて
御紹介していきます。
【ライブラリとは】
ライブラリを使わずにコードを書くと可読性が落ちて読み解くのに時間がかかってしまいます。
Pythonには標準ライブラリと外部ライブラリが存在しており、今回は標準ライブラリについて
ご紹介していきます。
用途に合わせてライブラリの解説と今後そのライブラリでどんな事ができるのかについても
併せて解説してまいります。
【Pandas】
Pythonにデータを読込み、クリーニング、欠損値の有無等の基礎分析に必要な作業を簡単に行うためのライブラリです。
オープンソースで、個人/商用問わず、誰でも無料で利用することができます。
一例として
・CSV形式のデータの読込:read_csv()
・Excelファイルの読込:read_excel()
・読み込んだファイルのヘッダーを確認:head()
・読み込んだファイルの欠損有無の確認:isnull()
等があります。
簡単に取扱う事が可能で必ず使うライブラリとして覚えておくと便利です。
【Numpy】
Pandasで読み込んだデータから特定のデータ同士を掛け合わせて計算を実行、
画像や音声処理などによく使われるライブラリです。
for文を削減してプログラムの処理速度を速くできたり、
シンプルで見やすいコードを書けるようになったりさまざまなメリットがあります。
【matplotlib】
Pandasで読み込んだデータから棒グラフや線グラフ、ばらつきなどを描画してくれる描画ライブラリです。
基礎分析のよく使うライブラリで
・折れ線グラフを作る:plot()
・散布図を作る:scatter()
等がよく使う描画コードですが、一部の機能を日本語で使う場合は日本語化する準備が必要になりますので
その点についても解説する予定です。
【sklearn】
機械学習のためのライブラリでこちらもimportして活用されることが多いです。
読み方は「サイキットラーン」で正式名称は「scikit-learn」です。
どのアルゴリズムも同じような書き方で可能で機械学習プログラミングでメジャーになってきてます。
また、サンプルのデータセットが付属していて、すぐに機械学習を試せます。
学習のフェーズと予測のフェーズはそれぞれ異なっているので学習するための実行と
予測するための実行それぞれを1行で書くことができます。
・学習するためのコード:.fix()
・予測を行うためのコード:predict()
【今後の機械学習関連の記事について】
また学習に際し活用したサイト等無料有料に関わらずご紹介してまいります。
本年もどうぞよろしくお願い申し上げます。
コメントを残す