Tabel pivot terus menjadi salah satu alat yang paling dihormati dan banyak digunakan dalam MS Excel. Apakah Anda seorang analis data, insinyur data, atau hanya pengguna biasa, kemungkinan Anda sudah memiliki titik lemah untuk MS Excel.
Meskipun demikian, ada peningkatan cakupan untuk mereplikasi alat dan utilitas MS Excel, terutama di Python. Tahukah Anda bahwa Anda dapat membuat tabel pivot ekstensif di DataFrames Python dengan beberapa baris kode itu sendiri?
Ya, itu benar; jika Anda tertarik, inilah cara Anda melakukannya.
Prasyarat untuk Membuat Tabel Pivot
Seperti bahasa pemrograman lainnya, bahkan Python membutuhkan Anda untuk memenuhi beberapa prasyarat sebelum Anda dapat melakukan pengkodean.
Untuk mendapatkan pengalaman yang paling optimal saat membuat tabel pivot pertama Anda dengan Python, inilah yang Anda perlukan:
- IDE Python: Sebagian besar kode Python memiliki lingkungan pengembangan terintegrasi (IDE) yang sudah diinstal sebelumnya pada sistem mereka. Ada beberapa IDE yang kompatibel dengan Python di pasar, termasuk Jupyter Notebook, Spyder, PyCharm, dan banyak lainnya.
- Contoh data: Sebagai ilustrasi, berikut adalah contoh kumpulan data untuk Anda kerjakan. Atau, jangan ragu untuk mengubah kode ini langsung di data langsung Anda.
tautan sampel data:Contoh Superstore
Mengimpor Perpustakaan Esensial
Karena Python bekerja pada konsep perpustakaan pihak ketiga, Anda perlu mengimpor Panda perpustakaan untuk membuat pivot.
Anda dapat menggunakan Panda untuk impor file Excel ke Python dan menyimpan data dalam DataFrame. Untuk mengimpor Panda, gunakan impor perintah dengan cara sebagai berikut:
impor panda sebagai pd
Cara Membuat Pivot dengan Python
Karena perpustakaan sekarang tersedia, Anda perlu mengimpor file Excel ke Python, yang merupakan dasar untuk membuat dan menguji pivot dengan Python. Simpan data yang diimpor dalam DataFrame dengan kode berikut:
# Buat DataFrame baru
# ganti dengan jalur Anda sendiri di sini
jalan = "C://Pengguna//pengguna/OneDrive//Desktop//"
# Anda dapat menentukan nama file di sini
berkas = "Contoh - Superstore.xls"
df = pd.read_excel (jalur + file)
df.kepala()
Di mana:
- df: Nama variabel untuk menyimpan data DataFrame
- pd: Alias untuk perpustakaan Panda
- baca_excel(): Pandas berfungsi untuk membaca file Excel ke Python
- jalur: Lokasi penyimpanan file Excel (Contoh Superstore)
- mengajukan: Nama file yang akan diimpor
- kepala(): Menampilkan lima baris pertama DataFrame, secara default
Kode di atas mengimpor file Excel ke Python dan menyimpan data dalam DataFrame. Akhirnya, kepala fungsi menampilkan lima baris data pertama.
Fungsi ini berguna untuk memastikan data diimpor dengan benar ke Python.
Bidang Tabel Pivot Manakah yang Ada di Python?
Seperti rekan Excel-nya, tabel pivot memiliki kumpulan bidang serupa dengan Python. Berikut adalah beberapa bidang yang perlu Anda ketahui:
- Data: Bidang data mengacu pada data yang disimpan dalam Python DataFrame
- Nilai: Data kolom yang digunakan dalam pivot
- Indeks: Kolom indeks untuk mengelompokkan data
- Kolom: Kolom membantu dalam menggabungkan data yang ada dalam DataFrame
Tujuan Dibalik Menggunakan Fungsi Indeks
Karena fungsi indeks adalah elemen utama dari tabel pivot, fungsi ini mengembalikan tata letak dasar data. Dengan kata lain, Anda dapat mengelompokkan data Anda dengan indeks fungsi.
Misalkan Anda ingin melihat beberapa nilai agregat untuk produk yang terdaftar di dalam Segmen kolom. Anda dapat menghitung agregat yang telah ditentukan sebelumnya (nilai rata-rata) dengan Python dengan mendefinisikan kolom yang ditunjuk sebagai nilai indeks.
df.pivot_table (indeks = "Segmen")
Di mana:
- df:DataFrame berisi data
- tabel pivot: Fungsi tabel pivot dengan Python
- indeks: Fungsi bawaan untuk mendefinisikan kolom sebagai indeks
- Segmen: Kolom yang akan digunakan sebagai nilai indeks
Nama variabel Python peka terhadap huruf besar/kecil, jadi hindari transisi dari nama variabel yang telah ditentukan sebelumnya yang tercantum dalam panduan ini.
Cara Menggunakan Nilai Multi-Indeks
Bila Anda ingin menggunakan beberapa kolom indeks, Anda dapat menentukan nama kolom di a daftar dalam fungsi indeks. Yang harus Anda lakukan adalah menentukan nama kolom dalam satu set tanda kurung siku ([ ]), seperti yang ditunjukkan di bawah ini:
df.pivot_table (indeks = ["Kategori", "Sub-Kategori"])
Fungsi pivot membuat indentasi kolom indeks dalam output. Python menampilkan berarti dari semua nilai numerik terhadap setiap nilai indeks.
Belajar Membatasi Nilai dalam Output
Karena Python memilih semua kolom numerik secara default, Anda dapat membatasi nilai untuk mengubah hasil yang ditampilkan di hasil akhir. Menggunakan nilai-nilai berfungsi untuk menentukan kolom yang ingin Anda lihat.
df.pivot_table (indeks = ["Wilayah", "Kategori", "Sub-Kategori"], nilai = "Penjualan")
Pada hasil akhir, akan ada tiga kolom indeks, dan nilai rata-rata untuk kolom Penjualan diadu dengan setiap elemen.
Mendefinisikan Fungsi Agregat dalam Tabel Pivot
Apa yang terjadi jika Anda tidak ingin menghitung nilai rata-rata secara default? Tabel pivot memiliki banyak fungsi lain, yang melampaui penghitungan rata-rata sederhana.
Berikut cara penulisan kodenya:
df.pivot_table (indeks = ["Kategori"], nilai = "Penjualan", aggfunc = [jumlah, maks, min, len])
Di mana:
- jumlah: Menghitung jumlah nilai
- maks: Menghitung nilai maksimum
- min: Menghitung nilai maksimum
- len: Menghitung jumlah nilai
Anda juga dapat menentukan masing-masing fungsi ini dalam baris kode yang terpisah.
Cara Menambahkan Total Besar ke Tabel Pivot
Tidak ada aset data yang lengkap tanpa total keseluruhan. Untuk menghitung dan menampilkan total keseluruhan per kolom data, gunakan: margin dan margin_name fungsi.
df.pivot_table (indeks = ["Kategori"], nilai = "Penjualan", aggfunc = [jumlah, maks, min, len], margin=Benar, margin_name='Total Besar')
Di mana:
- margin: Fungsi untuk menghitung total keseluruhan
- margin_name: Tentukan nama kategori di kolom indeks (misalnya, Grand Totals)
Ubah dan Gunakan Kode Akhir
Berikut kode singkat terakhir:
impor panda sebagai pd
# ganti dengan jalur Anda sendiri di sini
jalan = "C://Pengguna//pengguna/OneDrive//Desktop//"
# Anda dapat menentukan nama file di sini
berkas = "Contoh - Superstore.xls"
df = pd.read_excel (jalur + file)
df.pivot_table (indeks = ["Wilayah", "Kategori", "Sub-Kategori"], nilai = "Penjualan",
aggfunc = [jumlah, maks, min, len],
margin =BENAR,
margin_name='Total Besar')
Membuat Tabel Pivot dengan Python
Saat Anda menggunakan tabel Pivot, opsinya tidak terbatas. Python memungkinkan Anda dengan mudah menangani array data yang luas tanpa khawatir tentang perbedaan data dan kelambatan sistem.
Karena fungsionalitas Python tidak terbatas hanya untuk memadatkan data menjadi pivot, Anda dapat menggabungkan beberapa buku kerja dan lembar Excel, sambil melakukan serangkaian fungsi terkait dengan Python.
Dengan Python, selalu ada sesuatu yang baru di cakrawala.