Instagram adalah salah satu situs media sosial paling populer dengan miliaran pengguna. Semua orang mulai dari pelajar hingga selebriti memiliki akun Instagram. Data publik dari Instagram dapat menjadi nilai yang sangat besar bagi bisnis, pemasar, dan individu. Siapa pun dapat menggunakan data ini untuk melakukan analisis data, menargetkan pemasaran, dan menghasilkan wawasan.

Anda dapat menggunakan Python untuk membuat alat otomatis yang mengekstrak data Instagram.

Menginstal Perpustakaan yang Diperlukan

Penginstal adalah pustaka Python yang dapat Anda gunakan untuk mengekstrak data yang tersedia untuk umum dari Instagram. Anda dapat mengakses data seperti gambar, video, nama pengguna, no. posting, jumlah pengikut, jumlah berikut, bio, dll. menggunakan Installloader. Perhatikan bahwa Instaloader tidak berafiliasi dengan, diotorisasi, dipelihara, atau didukung oleh Instagram dengan cara apa pun.

Untuk menginstal instaloader melalui pip, jalankan perintah berikut:

pip Install installer

Anda harus memiliki pip diinstal pada sistem Anda untuk menginstal pustaka Python eksternal.

instagram viewer

Selanjutnya, Anda perlu menginstal pustaka Pandas Python. Pandas adalah pustaka Python yang terutama digunakan untuk melakukan manipulasi data dan analisis data. Jalankan perintah berikut untuk menginstalnya:

pip Install panda

Sekarang, Anda siap untuk mulai menyiapkan kode dan mengambil data dari Instagram.

Menyiapkan Kode Anda

Untuk menyiapkan alat pengambilan data Instagram, Anda perlu mengimpor pustaka Python Instaloader dan membuat instance kelas Instaloader. Setelah itu, Anda perlu memberikan pegangan Instagram dari profil tempat Anda ingin mengekstrak datanya.

Kode Instagram Extractor Python tersedia dalam repositori GitHub dan gratis untuk Anda gunakan di bawah Lisensi MIT.

impor installer

# Membuat instance kelas Instaloader
bot = installoader. Penginstal()

# Memuat profil dari pegangan Instagram
profil = installoader. Profile.from_username (bot.context, 'cristiano')
mencetak(Profil)

Ini adalah langkah pertama yang baik untuk memeriksa pekerjaan dasar. Anda akan melihat beberapa data yang bermakna tanpa kesalahan:

Mengekstrak Data Dari Profil

Anda dapat mengekstraksi data berharga yang tersedia untuk umum seperti nama pengguna, no. posting, jumlah pengikut, jumlah mengikuti, bio, ID pengguna, dan URL eksternal menggunakan Instaloader hanya dengan beberapa baris kode. Anda hanya perlu memberikan pegangan Instagram dari profil tersebut.

impor installer
impor panda sebagai pd

# Membuat instance kelas Instaloader
bot = installoader. Penginstal()

# Memuat profil dari pegangan Instagram
profil = installoader. Profile.from_username (bot.context, 'leomessi')
mencetak("Nama belakang: ", profil.nama pengguna)
mencetak("Identitas pengguna: ", profile.userid)
mencetak("Jumlah post: ", profile.mediacount)
mencetak("Jumlah Pengikut: ", profil.pengikut)
mencetak("Hitungan Berikut: ", profile.pengikut)
mencetak("Biografi: ", profil.biografi)
mencetak("URL eksternal: ", profil.external_url)

Anda akan melihat banyak informasi profil dari pegangan yang Anda tentukan:

Mengekstrak Email Dari Bio

Anda dapat mengekstrak alamat email dari bio Insta profil apa pun menggunakan ekspresi reguler. Anda perlu mengimpor Python ulang library dan meneruskan ekspresi reguler untuk memvalidasi email sebagai parameter ke re.findall() metode:

impor installer
impor ulang
# Membuat instance kelas Instaloader
bot = installoader. Penginstal()
profil = installoader. Profile.from_username (bot.context, "kekayaan")
mencetak("Nama belakang: ", profil.nama pengguna)
mencetak("Biografi: ", profil.biografi)
email = re.findall (r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", profil.biografi)
print("Email diekstrak dari biodata:")
mencetak(email)

Skrip akan mencetak apa pun yang dikenalinya sebagai alamat email di bio:

Mengekstrak Data Hasil Penelusuran Teratas

Saat Anda mencari sesuatu di Instagram, Anda mendapatkan beberapa hasil termasuk nama pengguna dan tagar. Anda dapat mengekstrak hasil pencarian teratas menggunakan get_profiles() Dan get_hashtags() metode. Anda hanya perlu menyediakan permintaan pencarian di installer. HasilPencarianTerrata() metode. Selanjutnya, Anda dapat mengulangi dan mencetak/menyimpan hasil individu.

impor installer

# Membuat instance kelas Instaloader
bot = installoader. Penginstal()

# Berikan permintaan pencarian di sini
search_results = installoader. HasilPenelusuran Teratas (bot.konteks, 'musik')

# Mengulangi nama pengguna yang diekstrak
untuknama belakangdi dalamHasil Pencarian.get_profiles():
mencetak(nama belakang)

# Mengulangi tagar yang diekstrak
untuktanda pagardi dalamHasil Pencarian.get_hashtags():
mencetak(tanda pagar)

Outputnya akan menyertakan nama pengguna dan tagar yang cocok:

Mengekstrak Pengikut & Mengikuti Akun

Anda dapat mengekstrak pengikut akun, dan yang mengikutinya sendiri, menggunakan Instaloader. Anda harus memberikan nama pengguna dan kata sandi Instagram untuk mengambil data ini.

Jangan pernah menggunakan akun pribadi Anda untuk mengekstrak data dari Instagram karena dapat membuat akun Anda diblokir sementara atau permanen.

Setelah membuat instance kelas Instaloader, Anda harus memberikan nama pengguna dan kata sandi Anda. Ini agar bot dapat masuk ke Instagram menggunakan akun Anda dan mengambil data pengikut dan mengikuti.

Selanjutnya, Anda perlu memberikan pegangan Instagram dari profil target. Itu dapatkan_pengikut() Dan get_followees() metode mengekstrak pengikut dan pengikut. Anda bisa mendapatkan nama pengguna pengikut dan pengikut menggunakan pengikut.nama pengguna Dan followee.nama pengguna properti masing-masing.

Jika Anda ingin menyimpan hasilnya dalam file CSV, Anda harus mengonversi data terlebih dahulu menjadi objek Pandas DataFrame. Menggunakan pd. DataFrame() metode untuk mengubah objek daftar menjadi DataFrame.

Terakhir, Anda dapat mengekspor objek DataFrame ke file CSV menggunakan to_csv() metode. Anda harus lulus namafile.csv sebagai parameter untuk metode ini untuk mendapatkan data yang diekspor dalam format file CSV.

Hanya pemilik akun yang dapat melihat semua pengikut dan pengikut. Anda tidak akan dapat mengekstrak semua data pengikut dan mengikuti menggunakan metode ini atau metode lainnya.

# Mengimpor Perpustakaan
impor installer
impor panda sebagai pd

# Membuat instance kelas Instaloader
bot = installoader. Penginstal()
bot.login (pengguna="Nama pengguna Anda", sandi="Kata sandi Anda")

# Memuat profil dari pegangan Instagram
profil = installoader. Profile.from_username (bot.context, 'Pegangan_target_akun_insta_Anda')

# Mengambil nama pengguna dari semua pengikut
pengikut = [pengikut.nama pengguna untuk pengikut di profile.get_followers()]

# Mengubah data menjadi DataFrame
followers_df = pd. DataFrame (pengikut)

# Menyimpan hasil dalam file CSV
followers_df.to_csv('pengikut.csv', indeks=Salah)

# Mengambil nama pengguna dari semua berikut
followings = [followee.nama pengguna untuk followee di profile.get_followees()]

# Mengubah data menjadi DataFrame
berikut_df = pd. DataFrame (berikut)

# Menyimpan hasil dalam file CSV
berikut_df.to_csv('berikut.csv', indeks=Salah)

Unduh Posting Dari Akun Instagram

Sekali lagi, untuk mengunduh kiriman dari akun mana pun, Anda harus memberikan nama pengguna dan kata sandi. Ini agar bot dapat masuk ke Instagram menggunakan akun Anda. Anda dapat mengambil semua data posting menggunakan dapatkan_posts() metode. Dan Anda dapat mengulangi dan mengunduh semua pos individual menggunakan unduh_posting() metode.

# Mengimpor Perpustakaan
impor installer
impor panda sebagai pd

# Buat instance kelas Instaloader
bot = installoader. Penginstal()
bot.login (pengguna="Nama pengguna Anda",passwd="Kata sandi Anda")

# Memuat profil dari pegangan Instagram
profil = installoader. Profile.from_username (bot.context, 'Pegangan_target_akun_insta_Anda')

# Mengambil semua posting dalam suatu objek
posting = profil.get_posts()

# Iterasi dan unduh semua posting individual
untuk indeks, posting di hitung (posting, 1):
bot.download_post (posting, target=f"{profile.username}_{indeks}")

Mengikis Web Menggunakan Python

Pengikisan data atau pengikisan web adalah salah satu cara paling umum untuk mengekstrak informasi berguna dari web. Anda dapat menggunakan data yang Anda ekstrak untuk pemasaran, pembuatan konten, atau pengambilan keputusan.

Python adalah bahasa pilihan untuk pengikisan data. Pustaka seperti BeautifulSoup, Scrapy, dan Pandas menyederhanakan ekstraksi, analisis, dan visualisasi data.