python入門 - xsrv.jp...python入門 ① データ操作 ② 機械学習 ③ pc自動化...

26
Python入門 データ操作 機械学習 PC自動化 第1教育病院 職員教育室 (スライド枚数 26枚)

Upload: others

Post on 13-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

Python入門   ① データ操作

  ② 機械学習  ③ PC自動化

 第1教育病院 職員教育室

 (スライド枚数 全26枚)

Page 2: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

Python(パイソン)とはPythonとはプログラミング言語の1つです。分かりやすい文法、かつ少ないコードで簡単にプログラムを記述できる、人気の高い言語です。

Page 3: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

Pythonの人気 (2019年6月時点)Pythonは世界的にも人気の言語です。オープンソースのプログラミング言語なので、誰でも無料で利用できます。

第3位

・プログラミング言語の人気ランキング(TIOBE PCI)

Page 4: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

PythonのwebサービスPythonは人工知能(AI)の分野でよく利用されており、大きな注目を浴びています。また、Youtube、Facebook、Instagram等のwebサービスもPythonで作られています。

Pythonで作られているサービス

Page 5: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

Pythonの3つのポイント(文系・ノンプログラマー向け)

機械学習による予測

パソコン操作の自動化

効率的なデータ操作

Page 6: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

Pythonの3つのポイント(文系・ノンプログラマー向け)

効率的なデータ操作1

→ まずはコチラから説明します

Page 7: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

効率的なデータ操作 (1/6)1

データ分析を行うには、まずは必要なデータを収集し、分類・整理・成型・取捨選択することで、「使えるデータ」に加工する必要があります。

データ分析作業の80%~90%は、その前処理が占めていると言われています。

Page 8: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

効率的なデータ操作 (2/6)1

Pythonを使うと「使えるデータ」にするためのデータの前処理を効率的に行い、自動化することができます。

具体例として、Excel操作を自動化するプログラミングコードを紹介します。

自動処理

Page 9: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

効率的なデータ操作 (3/6)1

ExcelファイルをGoogle colab(※)に読み込むことで、様々なデータ操作が可能です。

・次のスライドより、データ操作の 具体例を紹介します ↓

※Google colabとは、完全無料で利用できる クラウド型のプログラミング実行環境。 超高性能な演算処理が可能なGPU(100万円相当)

 を利用できるため、ビッグデータの解析も可能。

          → 環境設定の方法はコチラ

     

文字が読めない場合はコチラ

Page 10: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

効率的なデータ操作 (4/6)1

●データの結合 「商品マスタ」と「売上データ」の2つの  データに共通している商品コードをキー  にして横方向に結合。

●データの追加 列名に「金額」という新しい項目を追加し、「販売数量」と「単価」をかけた数値を表示。

Page 11: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

効率的なデータ操作 (5/6)1

●データの変更 商品名をカタカナの「バナナ」から、 ひらがなの「ばなな」へ変更。商品名 という列に対して処理を実行。

●データの抽出 販売数量が5以上のデータのみを 抽出。and演算子・or演算子など、 より複雑な条件設定も可能。

Page 12: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

効率的なデータ操作 (6/6)1

●データ操作のまとめ  [1] データ操作用のツールをインポート [2] Excelファイルの読み込み

  [3] データの結合 [4] データの追加  [5] データの変更 [6] データ抽出

作成したコード[1]〜[6]は、ボタン1つで全て実行することができます。

◎Pythonでは少ないコードで Excel作業を自動化すること ができます。

データ操作の詳細はコチラ

Page 13: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

Pythonの3つのポイント(文系・ノンプログラマー向け)

機械学習による予測

3→ 次にコチラを説明します

Page 14: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

機械学習による予測 (1/6)2

・次のスライドより、機械学習の手法 について説明します ↓

機械学習(Machine learning)は、人工知能(AI)に包括される1分野です。コンピューターが大量のデータの中からある特徴(パターン)を見つけ出してモデルを作成します

Pythonでは、そのモデルに従って新しいデータを当てはめることで、「将来の予測」や「データの分類」を行うことができます。

Page 15: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

機械学習による予測 (2/6)2

・次のスライドより、サンプルデータを使って 回帰分析の具体例を紹介します ↓

機械学習による予測モデルを作成するには、回帰分析という手法を使います。回帰分析とは、変数(X)が与えられた時に、相関関係にある値(Y)を予測することです。

右記の図のように、バラツキのあるデータとの全ての距離が最小になるように引かれた線が回帰直線(予測モデル)です。

単回帰分析

Page 16: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

機械学習による予測 (3/6)2

※データ数:計 442個

糖尿病患者のサンプルデータ(年齢・性別・BMI・平均血圧・総コレステロール・悪玉コレステロール・善玉コレステロール・Tch・itg・glu)から、1年後の疾患進行度の予測モデルを作成。

Page 17: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

機械学習による予測 (4/6)2

単回帰分析による予測 1つの説明変数(BMI)から目的変数 (1年後の疾患進行度)を予測。

重回帰分析による予測 複数の説明変数(年齢・性別・BMIなど) を使って目的変数(1年後の疾患進行度) を予測。因果関係の強さを数値化して、 適切な説明変数を元に予測を行います。

・次のスライドで、重回帰分析を実行する プログラミングコードを紹介します ↓

● 説明変数・・・予測対象の要因 ● 目的変数・・・予測対象

回帰直線(予測モデル)

データのバラツキが大きく、予測精度が低い

説明変数を増やす

Page 18: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

機械学習による予測 (5/6)2

①年齢・性別・平均血圧など(説明変数)  を「X」に代入。  ※右記のコード(df2.drop)は「1年後の疾患進行度」 以外のデータをXに代入するという意味です。

  重回帰分析の実行(Ireg.fit)  ※Pythonでは少ないコード(3行)で

   予測モデルを作成できます。

②1年後の疾患進行度(目的変数)  を「Y」に代入。

③「X」と「Y」の関係について機械学習  を行い、特徴(パターン)を見つける。

Page 19: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

機械学習による予測 (6/6)2

重回帰分析によって作成した予測モデルにテストデータを当てはめることで、将来を予測することができます。

  ・テストデータ②(年齢:50)

   → 1年後の疾患進行度(予測)は「 190.747・・」 

    ・テストデータ③(年齢:35)

    → 1年後の疾患進行度(予測)は「 105.007・・」

・テストデータ①(年齢:24)

 → 1年後の疾患進行度(予測)は「 173.091・・」

◎Pythonを使うと、誰でも簡単に 機械学習をはじめられます。

機械学習の詳細はコチラ

Page 20: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

Pythonの3つのポイント(文系・ノンプログラマー向け)

パソコン操作の自動化

3→ 次にコチラを説明します

Page 21: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

パソコン操作の自動化 (1/5)3

Pythonを使うと、マウスやキーボード操作を自動化することができます。

デスクトップ上でアプリケーションをまたぐ操作が可能で、最近話題のRPA(※)と同じような機能を持っています。

 ※RPAとは、ロボティック・プロセス・オート  メーションの略で、ロボット(ソフトウェア)  によって定型作業を自動化する技術のこと。

Page 22: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

パソコン操作の自動化 (2/5)3

①マウス操作

 → クリック操作、ドラッグ操作、   スクロール操作。

②キーボード操作

 → タイピング、ファンクションキー   入力、ショートカット入力。

  ③画像認識

    → 画像(手書き文字・写真など)を    認識し、文字データへ変換。

●Pythonで実行可能なパソコン操作     ・パソコン操作のコード一覧

Page 23: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

パソコン操作の自動化 (3/5)3

●クリックすると動画(youtube)が再生されます。 ※音声なし

【自動化の内容】

 ① Spotlight までマウスを移動

 ② Spotlight からExcelの起動

 ③ Excel ファイルへデータ入力

 ④ デスクトップへ名前を付けて保存

 ⑤ Excel ファイルを閉じる

◎Pythonを使うと、人が入力する よりも、正確でスピーディーな 処理が可能です。

PC自動化の詳細はコチラ

Page 24: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

パソコン操作の自動化 (4/5)3

●クリックすると動画(youtube)が再生されます。 ※音声なし

【自動化の内容】

 ① Excelの郵便番号をコピー

 ② テキストにペースト

 ③ Excelの住所をコピー

 ④ テキストにペースト

 ⑤ ①〜④の繰り返し   → 1万回の繰り返しも可能

◎Pythonを使うと、単純入力作業 をコンピューターに代行させる ことができます。

PC自動化の詳細はコチラ

Page 25: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

パソコン操作の自動化 (5/5)3

●OCR(光学的文字認識)技術により、画像データから 文字データへの変換が可能です。 

※一部変換に失敗していますが、概ね高い  精度で変換できています。

画像認識(OCR)の詳細はコチラ

・難易度の高い、手書き文字のデータ化の例

Page 26: Python入門 - xsrv.jp...Python入門 ① データ操作 ② 機械学習 ③ PC自動化 第1教育病院 職員教育室 (スライド枚数 全26枚) Python(パイソン)とは

まとめ

1効

率的

なデ

ータ操

「使え

るデ

ータ」に

する

ため

のデ

ータの

前処

理を自

動化

。一度

プロ

グラミン

グした

コー

ドは

ボタン

一つ

で何

度で

も実

行可

能。

2機

械学

習に

よる

予測

大量

のデ

ータか

らコン

ピュー

タが

パター

ンを学

習。「将

来の

予測

」「デ

ータの

分類

」が可

能。

3パ

ソコン

操作

の自

動化

マウ

スや

キー

ボー

ド操

作をプ

ログ

ラム

し、面

なル

ーチ

ン業

務を自

動化

。完全

無料

で誰

でも

利用

可能

Pythonは文法がシンプルで分かりやすいことから、文系卒の社会人やノンプログラマーでも独学で習得できるオススメの言語です。もし興味がありましたら、初心者のための学習サイトを開設したので参考にしてください → Pyhoo!JAPAN