Pandas adalah pustaka Python sumber terbuka yang terutama digunakan untuk manipulasi dan analisis data. Itu dibangun di atas pustaka NumPy dan menyediakan struktur data berkinerja tinggi dan mudah digunakan serta alat analisis data untuk bahasa pemrograman Python.
Dalam artikel ini, Anda akan mempelajari cara melakukan 6 operasi dasar menggunakan Pandas.
Menggunakan Contoh Panda
Anda dapat menjalankan contoh di artikel ini menggunakan notebook komputasi seperti Buku Catatan Jupyter, Google Colab, dll. Anda juga dapat menjalankan contoh dengan memasukkan kode langsung ke interpreter Python dalam mode interaktif.
Jika Anda ingin melihat kode sumber lengkap yang digunakan dalam artikel ini, Anda dapat mengakses file Notebook Python dari ini Repositori GitHub.
1. Cara Mengimpor Panda sebagai pd dan Mencetak Nomor Versi
Anda perlu menggunakan impor kata kunci untuk mengimpor perpustakaan apa pun dengan Python. Panda biasanya diimpor di bawah pd alias. Dengan pendekatan ini, Anda dapat merujuk ke paket Pandas sebagai pd dari pada panda.
impor panda sebagai pd
cetak (pd.__versi__)
Keluaran:
1.2.4
2. Cara Membuat Seri di Panda
Seri Pandas adalah larik satu dimensi yang menyimpan data jenis apa pun. Ini seperti kolom dalam tabel. Anda dapat membuat seri menggunakan array numpy, fungsi numpy, daftar, kamus, nilai skalar, dll.
Nilai dari deret tersebut diberi label dengan nomor indeksnya. Secara default, nilai pertama memiliki indeks 0, nilai kedua memiliki indeks 1, dan seterusnya. Untuk memberi nama label Anda sendiri, Anda perlu menggunakan indeks argumen.
Cara Membuat Seri Kosong
s = pd. Seri (dtype='float64')
S
Keluaran:
Seri([], dtype: float64)
Dalam contoh di atas, deret kosong dengan mengambang tipe data dibuat.
Cara Membuat Seri Menggunakan NumPy Array
impor panda sebagai pd
impor numpy sebagai np
d = np.array([1, 2, 3, 4, 5])
s = pd. Seri (d)
S
Keluaran:
0 1
1 2
2 3
3 4
4 5
tipe d: int32
Terkait: Operasi NumPy untuk Pemula
Cara Membuat Seri Menggunakan Daftar
d = [1, 2, 3, 4, 5]
s = pd. Seri (d)
S
Keluaran:
0 1
1 2
2 3
3 4
4 5
tipe d: int64
Cara Membuat Seri Dengan Indeks
Untuk membuat seri dengan indeks, Anda perlu menggunakan indeks argumen. Jumlah indeks harus sama dengan jumlah elemen dalam deret.
d = [1, 2, 3, 4, 5]
s = pd. Deret (d, indeks=["satu", "dua", "tiga", "empat", "lima"])
S
Keluaran:
satu 1
dua 2
tiga 3
empat 4
lima 5
tipe d: int64
Cara Membuat Seri Menggunakan Kamus
Kunci kamus menjadi label seri.
d = {"satu": 1,
"dua": 2,
"tiga": 3,
"empat": 4,
"lima": 5}
s = pd. Seri (d)
S
Keluaran:
satu 1
dua 2
tiga 3
empat 4
lima 5
tipe d: int64
Cara Membuat Deret Menggunakan Nilai Skalar
Jika Anda ingin membuat deret menggunakan nilai skalar, Anda harus menyediakan indeks argumen.
s = pd. Seri (1, indeks = ["a", "b", "c", "d"])
S
Keluaran:
sebuah 1
b 1
c 1
d 1
tipe d: int64
3. Cara Membuat Dataframe di Panda
DataFrame adalah struktur data dua dimensi di mana data disejajarkan dalam bentuk baris dan kolom. DataFrame dapat dibuat menggunakan kamus, daftar, daftar kamus, array numpy, dll. Di dunia nyata, DataFrames dibuat menggunakan penyimpanan yang ada seperti file CSV, file excel, database SQL, dll.
Objek DataFrame mendukung sejumlah atribut dan metode. Jika Anda ingin tahu lebih banyak tentang mereka, Anda dapat melihat dokumentasi resmi dari kerangka data panda.
Cara Membuat DataFrame Kosong
df = pd. Bingkai Data()
cetak (df)
Keluaran:
Bingkai Data Kosong
Kolom: []
Indeks: []
Cara Membuat DataFrame Menggunakan Daftar
listObj = ["MUO", "teknologi", "disederhanakan"]
df = pd. DataFrame (daftarObj)
cetak (df)
Keluaran:
0
0 MUO
1 teknologi
2 disederhanakan
Cara Membuat DataFrame Menggunakan Kamus ndarray/Daftar
batmanData = {'Nama Film': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Tahun Rilis': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
cetak (df)
Keluaran:
Nama Film Tahun Rilis
0 Batman Mulai 2005
1 Ksatria Kegelapan 2008
2 The Dark Knight Rises 2012
Cara Membuat DataFrame Menggunakan Daftar Daftar
data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, kolom = ['Name', 'Roll No.'])
cetak (df)
Keluaran:
Nama Gulungan No.
0 Alex 601
1 Bob 602
2 Cataline 603
Cara Membuat DataFrame Menggunakan Daftar Kamus
data = [{'Name': 'Alex', 'Roll No.': 601},
{'Name': 'Bob', 'Roll No.': 602},
{'Nama': 'Cataline', 'No. Roll': 603}]
df = pd. Bingkai Data (data)
cetak (df)
Keluaran:
Nama Gulungan No.
0 Alex 601
1 Bob 602
2 Cataline 603
Terkait: Cara Mengonversi Daftar Menjadi Kamus dengan Python
Cara Membuat DataFrame Menggunakan Fungsi zip()
Menggunakan ritsleting() berfungsi untuk menggabungkan daftar dengan Python.
Nama = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = daftar (zip (Nama, RollNo))
df = pd. DataFrame (listOfTuples, kolom = ['Name', 'Roll No.'])
cetak (df)
Keluaran:
Nama Gulungan No.
0 Alex 601
1 Bob 602
2 Cataline 603
4. Cara Membaca Data CSV di Panda
File "nilai yang dipisahkan koma" (CSV) adalah file teks terbatas yang menggunakan koma untuk memisahkan nilai. Anda dapat membaca file CSV menggunakan baca_csv() metode dalam panda. Jika Anda ingin mencetak seluruh DataFrame, gunakan ke_string() metode.
Dalam contoh ini dan selanjutnya, ini berkas CSV akan digunakan untuk melakukan operasi
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
cetak (df.to_string())
Keluaran:
5. Cara Menganalisis DataFrames Menggunakan Metode head(), tail(), dan info()
Cara Melihat Data Menggunakan Metode head()
NS kepala() metode ini adalah salah satu cara terbaik untuk mendapatkan gambaran umum singkat tentang DataFrame. Metode ini mengembalikan header dan jumlah baris yang ditentukan, mulai dari atas.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
cetak (df.head (10))
Keluaran:
Jika Anda tidak menentukan jumlah baris, 5 baris pertama akan dikembalikan.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
cetak (df.head())
Keluaran:
Cara Melihat Data Menggunakan Metode tail()
NS ekor() metode mengembalikan header dan jumlah baris yang ditentukan, mulai dari bawah.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
cetak (df.tail (10))
Keluaran:
Jika Anda tidak menentukan jumlah baris, 5 baris terakhir akan dikembalikan.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
cetak (df.tail())
Keluaran:
Cara Mendapatkan Info Tentang Data
NS info() metode mengembalikan ringkasan singkat DataFrame termasuk tipe indeks dan tipe kolom, nilai non-null, dan penggunaan memori.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
cetak (df.info())
Keluaran:
6. Cara Membaca Data JSON di Panda
JSON (JadaSrahasia HAIobjek notation) adalah format pertukaran data yang ringan. Anda dapat membaca file JSON menggunakan baca_json() metode dalam panda. Jika Anda ingin mencetak seluruh DataFrame, gunakan ke_string() metode.
Dalam contoh di bawah ini, ini berkas JSON digunakan untuk melakukan operasi.
Terkait: Apa itu JSON? Ikhtisar Seorang Awam
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
cetak (df.to_string())
Keluaran:
Segarkan Pengetahuan Python Anda Dengan Fungsi dan Metode bawaan
Fungsi membantu mempersingkat kode Anda dan meningkatkan efisiensinya. Fungsi dan metode seperti mengurangi(), membelah(), menghitung(), evaluasi(), bulat(), dll. dapat membuat kode Anda kuat dan mudah dimengerti. Itu selalu baik untuk mengetahui tentang fungsi dan metode built-in karena mereka dapat menyederhanakan tugas pemrograman Anda untuk sebagian besar.
Pustaka Standar Python berisi banyak fungsi untuk membantu tugas pemrograman Anda. Pelajari tentang yang paling berguna dan buat kode yang lebih kuat.
Baca Selanjutnya
- Pemrograman
- Python
- Pengembangan web
- Pemrograman
- Analisis data
Yuvraj adalah mahasiswa sarjana Ilmu Komputer di University of Delhi, India. Dia bersemangat tentang Pengembangan Web Full Stack. Ketika dia tidak menulis, dia menjelajahi kedalaman teknologi yang berbeda.
Berlangganan newsletter kami
Bergabunglah dengan buletin kami untuk kiat teknologi, ulasan, ebook gratis, dan penawaran eksklusif!
Klik di sini untuk berlangganan