Internet Movie Database (IMDb) adalah database online terbesar yang berisi informasi terkait film, serial televisi, video rumahan, video game, dan konten streaming. Database online berisi jutaan catatan akurat yang dapat Anda gunakan untuk melakukan analisis data.
Cinemagoer (sebelumnya dikenal sebagai IMDbPY) adalah pustaka Python untuk mengelola dan mengambil data dari basis data film IMDb. Anda dapat mengakses data tentang film, orang, dan perusahaan, yang selanjutnya dapat digunakan untuk analisis.
Menginstal Perpustakaan yang Diperlukan
Anda perlu menginstal pembuat film Pustaka Python untuk mengakses IMDb basis data. Jalankan perintah berikut di prompt perintah untuk menginstal perpustakaan:
pip Install pembuat film
Anda harus memiliki pip diinstal pada sistem Anda untuk menginstal pustaka Python eksternal.
Kode yang digunakan dalam proyek ini tersedia di a repositori GitHub dan gratis untuk Anda gunakan di bawah lisensi MIT.
Mengekstrak Data IMDb Menggunakan Python
Anda perlu mengimpor library cinemagoer sebelum menggunakannya dalam kode Anda.
dari imdb impor Pembuat film
ia = Cinemagoer()
Kode di atas mengimpor pustaka cinemagoer dan membuat instance dari kelas cinemagoer.
Mencari Film
Anda dapat mencari film dengan judul tertentu (atau serupa) menggunakan cari_film() metode. Misalnya, jika Anda ingin mencari film berjudul "rock", Anda perlu menjalankan kode berikut:
dari imdb impor Pembuat film
# Membuat instance kelas Cinemagoer
ia = Cinemagoer()
# Mencari film yang namanya rock
film = ia.search_movie('batu')
mencetak(film[0])
Ini harus mencetak film pertama yang ditemukannya, misalnya:
Anda bisa mendapatkan film dengan ID IMDb-nya. Anda kemudian dapat mengekstrak informasi lebih lanjut seperti nama sutradara, dan genre. Kamu butuh loop melalui daftar untuk mendapatkan informasi individu.
dari imdb impor Pembuat film
# Membuat instance kelas Cinemagoer
ia = Cinemagoer()# Mendapatkan film dengan ID IMDb
film = ia.get_movie('0468569')
mencetak(film)# Mencetak nama sutradara film
mencetak('Sutradara:')untuk sutradara dalam film['direksi']:
cetak (sutradara['nama'])# mencetak genre film
mencetak('Genre:')
untuk genre dalam film['genre']:
mencetak(genre)
Dalam output, Anda akan melihat nama film yang diberikan, sutradaranya, dan genre-nya:
Mencari Seseorang
Anda dapat mencari orang menggunakan pencari_orang() metode. Misalnya, jika Anda ingin mencari "Heath", Anda perlu menjalankan kode berikut:
dari imdb impor Pembuat film
# Membuat instance kelas Cinemagoer
ia = Cinemagoer()
# Mencari orang yang memiliki nama Heath
orang = ia.search_person('Heath')
mencetak(orang[0])
Anda akan melihat nama orang pertama yang cocok yang ditemukan oleh pencarian:
Mencari Perusahaan
Anda dapat mencari perusahaan menggunakan cari_perusahaan() metode. Misalnya, jika Anda ingin mencari "Universal", Anda perlu menjalankan kode berikut:
dari imdb impor Pembuat film
# Membuat instance kelas Cinemagoer
ia = Cinemagoer()
# Mencari perusahaan yang memiliki nama Universal
perusahaan = ia.search_company('Universal')
mencetak(perusahaan)
Anda akan mendapatkan daftar semua perusahaan yang memiliki nama Universal.
Anda juga dapat mengambil data orang dan perusahaan menggunakan ID-nya.
dari imdb impor Pembuat film
# Membuat instance kelas Cinemagoer
ia = Cinemagoer()# Mendapatkan data orang dengan ID
orang = ia.get_person('0005132')
cetak (orang['nama'])
cetak (orang['tanggal lahir'])
# Mendapatkan data perusahaan dengan ID
perusahaan = ia.get_perusahaan('0005073')
cetak (perusahaan['nama'])
Outputnya akan menampilkan detail orang dan nama perusahaan:
Menemukan Film Atas dan Bawah
Anda dapat mengambil data untuk 250 film teratas dan 100 film terbawah menggunakan get_top250_movies() Dan get_bottom100_movies() metode, masing-masing:
dari imdb impor Pembuat film
# Membuat instance kelas Cinemagoer
ia = Cinemagoer()# Menemukan 250 film teratas
atas = ia.get_top250_movies()
mencetak(atas[0])
# Menemukan 100 film terbawah
bawah = ia.get_bottom100_movies()
mencetak(dasar[0])
Sebagai tanggapan, Anda akan melihat nama film terbaik dan nama film terburuk:
Perpustakaan cinemagoer juga menyediakan beberapa metode lain seperti get_top250_tv(), get_popular100_movies(), Dan get_top250_indian_movies().
Analisis data adalah evaluasi data menggunakan alat analisis atau statistik untuk mengekstrak informasi. Popularitas analisis data tumbuh setiap hari. Sekarang digunakan oleh bisnis, perusahaan pemasaran, dan tim olahraga. Proses analitik data yang lengkap mencakup menentukan tujuan, mengajukan pertanyaan, pengumpulan data, scrubbing data, analisis data, dan menyimpulkan hasil.
Anda bisa mendapatkan kumpulan data untuk proyek Anda menggunakan pustaka Python seperti Cinemagoer atau melalui platform online seperti Kaggle. Selain bahasa lengkap seperti Python dan R, Anda dapat menggunakan alat lain seperti Microsoft Excel, Tableau, dan Stata untuk melakukan analisis data.