PR

PythonでExcelデータを抽出する簡単3ステップ

データ抽出アイキャッチ Python
記事内に広告が含まれています。

「Excelファイルから特定のデータだけ取り出したい…」
「Excelファイルからデータを取り出す作業を自動化したい…」

Pythonを使えば、自分がExcelファイルから取り出したいデータを自動で抽出することができるようになります。
たくさんのデータから特定のデータだけ取り出すことができれば、仕事での作業効率もアップしますね!

この記事では、Excelからデータを取り出す作業を自動化したい方に向けて、「PythonでExcelデータを抽出する方法」を紹介していきます。

簡単3ステップでデータ抽出自動化を実現することができるようになります。
プログラミング初心者でも簡単に真似できるので、是非参考にしてみて下さい!

Excelデータ抽出簡単3ステップ
1. 抽出するExcelファイルの用意
2. 作業自動化に必要なPythonライブラリのインストール
3. Pythonコードの作成

Excelデータ抽出簡単3ステップ

抽出するExcelファイルの用意

まず最初に、Pythonで抽出したいExcelファイルを用意します。
今回は、サンプルとして以下のようなExcelファイルを用意しました。

sample.xlsx

このExcelファイルからPythonを使って、5人のテスト結果から、合計が200点以上の人だけ抽出していきたいと思います。

作業自動化に必要なPythonライブラリのインストール

次に、作業自動化に必要なPythonライブラリのインストールをしていきたいと思います。
Excelデータの抽出に必要なライブラリは「pandas」だけです。

pandasとは、Pythonでデータ分析を容易にできるようにするためのライブラリです。
pandasは、データフレームという形式でデータを扱います。

ライブラリをイストールするためには、ターミナルでpipコマンドを使う必要があります。
インストールができていない方は、以下のコマンドでインストールして下さい。

pip install pandas

これで、Excelデータを抽出するための準備は整いました。

Pythonコードの作成

最後に、Pythonコードの作成をしていきます。
以下のPythonコードで特定のデータを抽出できるようになります。

プログラミング初心者に向けて、コメントを多めに書いたので、コードだけじゃ理解できない方はコメントを参考にして下さい。

#必要なライブラリのインポート
import pandas as pd

#Excelファイルパスの設定
Excel_filepath = "./sample.xlsx"
#データフレームの設定
df = pd.read_excel(Excel_filepath, index_col=0)

#合計が200点以上の生徒を抽出
ans_df = df[df["合計"] >= 200]

#抽出結果をExcelに書き込む
ans_df.to_excel("./result.xlsx", sheet_name="抽出結果")

用意したExcelファイルと上記のPythonファイルを同じフォルダの中に設置してから、Pythonファイルを実行します。
※2つのファイルを違うところに設置してしまうと、Excelファイルパスを読み込むときにエラーになってしまいます。

Pythonファイルを実行すると、同じフォルダの中に「result.xlsx」というExcelファイルが作成されています。
開いてみると、中身は以下のようになっています。

result.xlsx

フォーマットは違いますが、合計が200点以上の生徒をしっかり抽出できていますね!
これで、Excelデータ抽出の完了です。

このPythonコードを応用すると、さらに複雑な条件に合ったデータのみ抽出できるようになります。

さいごに

今回は、「PythonでExcelファイルからデータを抽出する方法」について紹介してきました。
データ抽出手順をしっかり覚えて、どんどん作業を自動化して効率化アップを目指して下さい!

また私のサイトでは、他にもPythonを使った業務自動化に関する情報を発信しています。
興味のある方は、関連記事も参考にしてみて下さい!

ご精読ありがとうございました!

関連記事

コメント

タイトルとURLをコピーしました