「Excelファイルから特定のデータだけ取り出したい…」
「Excelファイルからデータを取り出す作業を自動化したい…」
Pythonを使えば、自分がExcelファイルから取り出したいデータを自動で抽出することができるようになります。
たくさんのデータから特定のデータだけ取り出すことができれば、仕事での作業効率もアップしますね!
この記事では、Excelからデータを取り出す作業を自動化したい方に向けて、「PythonでExcelデータを抽出する方法」を紹介していきます。
簡単3ステップでデータ抽出自動化を実現することができるようになります。
プログラミング初心者でも簡単に真似できるので、是非参考にしてみて下さい!
Excelデータ抽出簡単3ステップ
1. 抽出するExcelファイルの用意
2. 作業自動化に必要なPythonライブラリのインストール
3. Pythonコードの作成
Excelデータ抽出簡単3ステップ
抽出するExcelファイルの用意
まず最初に、Pythonで抽出したいExcelファイルを用意します。
今回は、サンプルとして以下のようなExcelファイルを用意しました。
このExcelファイルからPythonを使って、5人のテスト結果から、合計が200点以上の人だけ抽出していきたいと思います。
作業自動化に必要なPythonライブラリのインストール
次に、作業自動化に必要なPythonライブラリのインストールをしていきたいと思います。
Excelデータの抽出に必要なライブラリは「pandas」だけです。
pandasとは、Pythonでデータ分析を容易にできるようにするためのライブラリです。
pandasは、データフレームという形式でデータを扱います。
ライブラリをイストールするためには、ターミナルでpipコマンドを使う必要があります。
インストールができていない方は、以下のコマンドでインストールして下さい。
pip install pandas
これで、Excelデータを抽出するための準備は整いました。
Pythonコードの作成
最後に、Pythonコードの作成をしていきます。
以下のPythonコードで特定のデータを抽出できるようになります。
プログラミング初心者に向けて、コメントを多めに書いたので、コードだけじゃ理解できない方はコメントを参考にして下さい。
#必要なライブラリのインポート
import pandas as pd
#Excelファイルパスの設定
Excel_filepath = "./sample.xlsx"
#データフレームの設定
df = pd.read_excel(Excel_filepath, index_col=0)
#合計が200点以上の生徒を抽出
ans_df = df[df["合計"] >= 200]
#抽出結果をExcelに書き込む
ans_df.to_excel("./result.xlsx", sheet_name="抽出結果")
用意したExcelファイルと上記のPythonファイルを同じフォルダの中に設置してから、Pythonファイルを実行します。
※2つのファイルを違うところに設置してしまうと、Excelファイルパスを読み込むときにエラーになってしまいます。
Pythonファイルを実行すると、同じフォルダの中に「result.xlsx」というExcelファイルが作成されています。
開いてみると、中身は以下のようになっています。
フォーマットは違いますが、合計が200点以上の生徒をしっかり抽出できていますね!
これで、Excelデータ抽出の完了です。
このPythonコードを応用すると、さらに複雑な条件に合ったデータのみ抽出できるようになります。
さいごに
今回は、「PythonでExcelファイルからデータを抽出する方法」について紹介してきました。
データ抽出手順をしっかり覚えて、どんどん作業を自動化して効率化アップを目指して下さい!
また私のサイトでは、他にもPythonを使った業務自動化に関する情報を発信しています。
興味のある方は、関連記事も参考にしてみて下さい!
ご精読ありがとうございました!
コメント