Python, sebagai bahasa, sangat berharga, terutama saat Anda ingin bekerja dengan data terstruktur. Karena orang menyimpan banyak data dalam file Excel, sangat penting untuk mengkonsolidasikan banyak file untuk menghemat waktu dan tenaga.

Python memungkinkan Anda melakukan hal itu; tidak peduli berapa banyak file Excel yang ingin Anda gabungkan, Anda dapat melakukannya dengan relatif mudah. Mengingat jangkauan pustaka dan sumber daya pihak ketiganya, Anda dapat mengimpor dan menggunakan alat multifaset Python untuk melakukan penawaran Anda.

Dalam panduan ini, Anda perlu menginstal dan menggunakan perpustakaan Pandas untuk mengimpor data ke Python sebelum menggabungkannya.

Instal Perpustakaan Pandas dengan Python

Pandas adalah perpustakaan pihak ketiga yang dapat Anda instal dengan Python. Beberapa IDE sudah menginstal Panda di dalamnya.

Jika Anda menggunakan versi IDE yang tidak disertakan dengan Panda yang sudah diinstal sebelumnya, yakinlah, Anda dapat menginstalnya langsung dengan Python.

instagram viewer

Berikut cara menginstal Pandas:

pip install panda

Jika Anda menggunakan Jupyter Notebook, Anda dapat menginstal Pandas secara langsung dengan perintah PIP. Sebagian besar, ketika Anda telah menginstal Jupyter dengan Anaconda, ada kemungkinan besar sudah memiliki Panda yang tersedia untuk penggunaan langsung.

Jika Anda tidak dapat memanggil Pandas, Anda dapat menggunakan perintah di atas untuk menginstalnya secara langsung.

Menggabungkan File Excel Dengan Python

Pertama, Anda perlu membuat folder di lokasi pilihan Anda dengan semua file Excel. Setelah folder siap, Anda dapat mulai menulis kode untuk mengimpor perpustakaan.

Anda akan menggunakan dua variabel dalam kode ini:

  1. Panda: Pustaka Pandas menyediakan bingkai data untuk menyimpan file Excel.
  2. OS: Pustaka bermanfaat untuk membaca data dari folder mesin Anda

Untuk mengimpor perpustakaan ini, gunakan perintah ini:

Impor Panda sebagai pd
Impor OS
  • Impor: Sintaks python digunakan untuk mengimpor perpustakaan di Python
  • Panda: Nama perpustakaan
  • pd: Alias ​​​​diberikan ke perpustakaan
  • OS: Perpustakaan untuk mengakses folder sistem

Setelah Anda mengimpor perpustakaan, buat dua variabel untuk menyimpan jalur file input dan output. Jalur file input diperlukan untuk mengakses folder file. Jalur file output diperlukan karena file gabungan akan diekspor ke sana.

Jika Anda menggunakan Python, pastikan Anda mengubah backslash menjadi forward-slash (\ ke /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/File Excel/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Tambahkan / di akhir juga untuk menyelesaikan jalan.

File folder tersedia dalam daftar. Buat daftar untuk menyimpan semua referensi file dari folder input menggunakan daftardir fungsi dari OS Perpustakaan.

Jika Anda tidak yakin dengan fungsi yang tersedia dalam perpustakaan, Anda dapat menggunakan dir fungsi dengan nama perpustakaan. Misalnya, untuk memeriksa versi yang tepat dari fungsi listdir, Anda dapat menggunakan perintah sebagai berikut:

dir (OS)

Outputnya akan terdiri dari semua fungsi terkait yang tersedia dalam perpustakaan OS. Fungsi listdir adalah salah satu dari banyak fungsi yang tersedia dalam perpustakaan ini.

Buat variabel baru untuk menyimpan file input dari folder.

excel_file_list = os.listdir (input_file_path)

Cetak variabel ini untuk melihat nama file yang disimpan di dalam folder. Semua file yang disimpan dalam folder akan ditampilkan setelah Anda menggunakan fungsi cetak.

cetak (daftar_file_excel)

Selanjutnya, Anda perlu menambahkan bingkai data baru untuk menyimpan setiap file Excel. Bayangkan sebuah bingkai data sebagai wadah untuk menyimpan data. Berikut perintah untuk membuat bingkai data.

df = pd. Bingkai Data()
  • df: Variabel untuk menyimpan nilai DataFrame
  • pd: Alias ​​untuk perpustakaan panda
  • Bingkai Data: Sintaks default untuk menambahkan bingkai data

Folder input memiliki tiga .xlsx file dalam contoh ini. Nama-nama file tersebut adalah:

File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx

Untuk membuka setiap file dari folder ini, Anda perlu menjalankan loop. Loop akan berjalan untuk setiap file dalam daftar yang dibuat di atas.

Inilah cara Anda dapat melakukannya:

untuk excel_files di excel_file_list:

Selanjutnya, perlu untuk memeriksa ekstensi file karena kode hanya akan membuka file XLSX. Untuk memeriksa file-file ini, Anda dapat menggunakan Jika penyataan.

Menggunakan berakhir dengan fungsinya untuk keperluan tersebut, sebagai berikut:

untuk excel_files di excel_file_list:

jika excel_files.endswith(".xlsx"):

  • excel_file: Daftar dengan semua nilai file
  • berakhir dengan: Berfungsi untuk memeriksa ekstensi file
  • (".xlsx"): Nilai string ini dapat berubah, tergantung pada apa yang ingin Anda cari

Sekarang setelah Anda mengidentifikasi file Excel, Anda dapat membuat bingkai data baru untuk membaca dan menyimpan file satu per satu.

untuk excel_files di excel_file_list:

jika excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)

  • df1: Bingkai data baru
  • pd: perpustakaan panda
  • baca_excel: Berfungsi untuk membaca file Excel di dalam perpustakaan Pandas
  • masukan_file_path: Jalur folder tempat file disimpan
  • excel_file: Variabel apa pun yang digunakan dalam perulangan for

Untuk mulai menambahkan file, Anda perlu menggunakan menambahkan fungsi.

untuk excel_files di excel_file_list:

jika excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)
df = df.tambahkan (df1)

Akhirnya, sekarang kerangka data konsolidasi sudah siap, Anda dapat mengekspornya ke lokasi keluaran. Dalam hal ini, Anda mengekspor bingkai data ke file XLSX.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: Kerangka data untuk diekspor
  • ke_excel: Perintah yang digunakan untuk mengekspor data
  • output_file_path: Jalur yang ditentukan untuk menyimpan output
  • Consolidated_file.xlsx: Nama file konsolidasi

Sekarang, mari kita lihat kode terakhir:

#Panda digunakan sebagai kerangka data untuk menangani file Excel
impor panda sebagai pd
impor os

# ubah garis miring dari “\” menjadi “/”, jika Anda menggunakan perangkat Windows

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/File Excel/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

#buat daftar untuk menyimpan semua referensi file dari folder input menggunakan fungsi listdir dari perpustakaan os.
#Untuk melihat isi library (seperti fungsi listdir, Anda bisa menggunakan fungsi dir pada nama library).
#Gunakan dir (library_name) untuk membuat daftar konten

excel_file_list = os.listdir (input_file_path)

#cetak semua file yang tersimpan di folder, setelah menentukan daftar
excel_file_list

#Setelah setiap file terbuka, gunakan fungsi append untuk mulai menggabungkan data yang disimpan dalam banyak file

#buat kerangka data kosong baru, untuk menangani impor file excel
df = pd. Bingkai Data()

#Jalankan for loop untuk mengulang setiap file dalam daftar
untuk excel_files di excel_file_list:
#periksa hanya file sufiks .xlsx
jika excel_files.endswith(".xlsx"):
#buat kerangka data baru untuk membaca/membuka setiap file Excel dari daftar file yang dibuat di atas
df1 = pd.read_excel (input_file_path+excel_files)
#tambahkan setiap file ke dalam kerangka data asli yang kosong
df = df.tambahkan (df1)

#transfer hasil akhir ke file Excel (xlsx) di jalur keluaran
df.to_excel (output_file_path+"Consolidated_file.xlsx")

Menggunakan Python untuk Menggabungkan Beberapa Buku Kerja Excel

Pandas Python adalah alat yang sangat baik untuk pemula dan pengguna tingkat lanjut. Pustaka digunakan secara luas oleh pengembang yang ingin menguasai Python.

Bahkan jika Anda seorang pemula, Anda bisa mendapatkan keuntungan besar dengan mempelajari nuansa Pandas dan bagaimana perpustakaan digunakan dalam Python.

6 Operasi Panda untuk Pemula

Pahami Panda dengan operasi pemula ini.

Baca Selanjutnya

MembagikanMenciakSurel
Topik-topik terkait
  • Pemrograman
  • Python
  • Microsoft Excel
  • Spreadsheet
Tentang Penulis
Gaurav Siyal (59 Artikel Diterbitkan)

Gaurav Siyal memiliki dua tahun pengalaman menulis, menulis untuk serangkaian perusahaan pemasaran digital dan dokumen siklus hidup perangkat lunak.

More From Gaurav Siyal

Berlangganan newsletter kami

Bergabunglah dengan buletin kami untuk kiat teknologi, ulasan, ebook gratis, dan penawaran eksklusif!

Klik di sini untuk berlangganan