Jika Anda menggunakan Python, bahkan untuk tugas yang paling sederhana, Anda mungkin menyadari pentingnya perpustakaan pihak ketiganya. Pustaka Pandas, dengan dukungan luar biasa untuk DataFrames, adalah salah satu pustaka tersebut.

Anda dapat mengimpor beberapa jenis file ke Python DataFrames dan membuat berbagai versi untuk menyimpan kumpulan data yang berbeda. Setelah Anda mengimpor data menggunakan DataFrames, Anda dapat menggabungkannya untuk melakukan analisis mendetail.

Mengatasi Dasar-dasarnya

Sebelum Anda mulai menggabungkan, Anda harus memiliki DataFrames untuk digabungkan. Untuk tujuan pengembangan, Anda dapat membuat beberapa data dummy untuk bereksperimen.

Buat DataFrames dengan Python

Sebagai langkah pertama, impor perpustakaan Pandas ke file Python Anda. Pandas adalah perpustakaan pihak ketiga yang menangani DataFrames dengan Python. Anda dapat menggunakan impor pernyataan untuk menggunakan perpustakaan, sebagai berikut:

impor panda sebagai pd

Anda dapat menetapkan alias ke nama perpustakaan untuk mempersingkat referensi kode Anda.

instagram viewer

Anda perlu membuat kamus, yang dapat Anda ubah menjadi DataFrames. Untuk hasil terbaik, buat dua variabel kamus—dict1 dan dict2—untuk menyimpan informasi tertentu:

dict1 = {"identitas pengguna": ["001", "002", "003", "004", "005"],
"NamaF": ["John", "Brad", "Ron", "jalan raya", "Kris"],
"Nama L": ["Harley", "Cohen", "Dahl", "harrington", "Kerr-Hislop"]}

dict2 = {"identitas pengguna": ["001", "002", "003", "004"], "Usia": [15, 28, 34, 24]}

Ingat, Anda harus memiliki elemen umum di kedua nilai kamus, untuk bertindak sebagai kunci utama untuk menggabungkan DataFrames Anda nanti.

Ubah Kamus Anda Menjadi DataFrames

Untuk mengonversi nilai kamus Anda menjadi DataFrames, Anda dapat menggunakan metode berikut:

df1 = pd. DataFrame (dict1)
df2 = pd. DataFrame (dict2)

Beberapa IDE memungkinkan Anda memeriksa nilai dalam DataFrame dengan merujuk fungsi DataFrame dan menekan Jalankan/Jalankan. Ada banyak IDE yang kompatibel dengan Python, sehingga Anda dapat memilih dan memilih salah satu yang paling mudah untuk Anda pelajari.

Setelah Anda puas dengan konten DataFrames Anda, Anda dapat melanjutkan ke langkah penggabungan.

Menggabungkan Bingkai Dengan Fungsi Gabung

Fungsi gabungan adalah fungsi Python pertama yang dapat Anda gunakan untuk menggabungkan dua DataFrames. Fungsi ini mengambil argumen default berikut:

pd.merge (DataFrame1, DataFrame2, bagaimana= Tipedarimenggabungkan)

Di mana:

  • pd adalah alias untuk perpustakaan Pandas.
  • menggabungkan adalah fungsi yang menggabungkan DataFrames.
  • DataFrame1 dan DataFrame2 adalah dua DataFrames untuk digabungkan.
  • bagaimana mendefinisikan tipe gabungan.

Beberapa argumen opsional tambahan tersedia, yang dapat Anda gunakan saat Anda memiliki struktur data yang kompleks.

Anda dapat menggunakan nilai yang berbeda untuk parameter how untuk menentukan jenis penggabungan yang akan dilakukan. Jenis penggabungan ini akan familier jika Anda sudah menggunakan SQL untuk bergabung dengan tabel database.

Gabung Kiri

Jenis penggabungan kiri menjaga nilai DataFrame pertama tetap utuh dan menarik nilai yang cocok dari DataFrame kedua.

Penggabungan Kanan

Jenis penggabungan yang tepat menjaga nilai DataFrame kedua tetap utuh dan menarik nilai yang cocok dari DataFrame pertama.

Gabungan Batin

Jenis penggabungan dalam mempertahankan nilai yang cocok dari kedua DataFrames dan menghapus nilai yang tidak cocok.

Gabungan Luar

Jenis gabungan luar mempertahankan semua nilai yang cocok dan tidak cocok dan menggabungkan DataFrames bersama-sama.

Cara Menggunakan Fungsi Concat

Itu concat function adalah opsi yang fleksibel dibandingkan dengan beberapa fungsi gabungan Python lainnya. Dengan fungsi concat, Anda dapat menggabungkan DataFrames secara vertikal dan horizontal.

Namun, kelemahan menggunakan fungsi ini adalah membuang nilai yang tidak cocok secara default. Seperti beberapa fungsi terkait lainnya, fungsi ini memiliki beberapa argumen, yang hanya sedikit yang penting untuk rangkaian yang sukses.

concat (dataframe, sumbu=0, gabung='luar'/batin)

Di mana:

  • concat adalah fungsi yang bergabung dengan DataFrames.
  • kerangka data adalah urutan DataFrames untuk digabungkan.
  • sumbu mewakili arah penggabungan, 0 menjadi horizontal, 1 menjadi vertikal.
  • Ikuti menentukan gabungan luar atau dalam.

Dengan menggunakan dua DataFrame di atas, Anda dapat mencoba fungsi concat sebagai berikut:

# tentukan kerangka data dalam format daftar
df_merged_concat = pd.concat([df1, df2])

# cetak hasil fungsi Concat
mencetak(df_merged_concat)

Tidak adanya sumbu dan argumen gabungan dalam kode di atas menggabungkan dua kumpulan data. Output yang dihasilkan memiliki semua entri, terlepas dari status kecocokan.

Demikian pula, Anda dapat menggunakan argumen tambahan untuk mengontrol arah dan output dari fungsi concat.

Untuk mengontrol output dengan semua entri yang cocok:

# Menggabungkan semua nilai yang cocok antara dua kerangka data berdasarkan kolomnya
df_merged_concat = pd.concat([df1, df2], axis=1, gabung = 'batin')

mencetak(df_merged_concat)

Hasilnya hanya berisi semua nilai yang cocok antara dua DataFrames.

Menggabungkan DataFrames Dengan Python

DataFrames adalah bagian integral dari Python, mengingat fleksibilitas dan fungsionalitasnya. Mengingat kegunaannya yang beragam, Anda dapat menggunakannya secara ekstensif untuk melakukan berbagai tugas dengan sangat mudah.

Jika Anda masih mempelajari Python DataFrames, coba impor beberapa file Excel, lalu gabungkan dengan pendekatan yang berbeda.