Mesin pencari seperti Google adalah bagian dari apa yang membuat internet begitu kuat. Dengan beberapa penekanan tombol dan klik tombol, jawaban yang paling relevan untuk pertanyaan Anda akan muncul. Tapi pernahkah Anda bertanya-tanya bagaimana mesin pencari bekerja? Perayap web adalah bagian dari jawabannya.
Jadi, apa itu perayap web, dan bagaimana cara kerjanya?
Apa itu Perayap Web?
Saat Anda mencari sesuatu di mesin pencari, mesin tersebut harus memindai jutaan (atau miliaran) halaman web dengan cepat untuk menampilkan hasil yang paling relevan. Perayap web (juga dikenal sebagai spider atau bot mesin pencari) adalah program otomatis yang "merangkak" internet dan mengumpulkan informasi tentang halaman web dengan cara yang mudah diakses.
Kata "merangkak" mengacu pada cara perayap web melintasi internet. Perayap web juga dikenal sebagai "laba-laba". Nama ini berasal dari cara mereka merayapi web—seperti bagaimana laba-laba merayapi jaring laba-laba mereka.
Perayap web menilai dan mengumpulkan data pada halaman web sebanyak mungkin. Mereka melakukan ini agar data mudah diakses dan dicari, oleh karena itu mengapa mereka sangat penting bagi mesin pencari.
Pikirkan perayap web sebagai editor yang menyusun indeks di akhir buku. Tugas indeks adalah memberi tahu pembaca di mana di dalam buku setiap topik atau frase kunci muncul. Demikian juga, perayap web membuat indeks yang digunakan mesin telusur untuk menemukan informasi yang relevan pada kueri penelusuran dengan cepat.
Apa itu Pengindeksan Pencarian?
Seperti yang telah kami sebutkan, pengindeksan pencarian sebanding dengan menyusun indeks di bagian belakang buku. Di satu sisi, pengindeksan pencarian seperti membuat peta internet yang disederhanakan. Ketika seseorang mengajukan pertanyaan kepada mesin pencari, mesin pencari menjalankannya melalui indeks mereka, dan halaman yang paling relevan muncul terlebih dahulu.
Tapi, bagaimana mesin pencari tahu halaman mana yang relevan?
Pengindeksan pencarian terutama berfokus pada dua hal: teks pada halaman dan metadata halaman. Teks adalah segala sesuatu yang Anda lihat sebagai pembaca, sedangkan metadata adalah informasi tentang halaman yang dimasukkan oleh pembuat halaman, dikenal sebagai "tag meta." Tag meta mencakup hal-hal seperti deskripsi halaman dan judul meta, yang muncul dalam pencarian hasil.
Mesin pencari seperti Google akan mengindeks semua teks pada halaman web (kecuali untuk kata-kata tertentu seperti “the” dan “a” dalam beberapa kasus). Kemudian, ketika sebuah istilah dicari di mesin pencari, ia akan dengan cepat menelusuri indeksnya untuk halaman yang paling relevan.
Bagaimana Cara Kerja Perayap Web?
Perayap web berfungsi seperti namanya. Mereka mulai di halaman web atau URL yang dikenal dan mengindeks setiap halaman di URL itu (sebagian besar waktu, pemilik situs web meminta mesin pencari untuk merayapi URL tertentu). Saat mereka menemukan hyperlink di halaman tersebut, mereka akan menyusun daftar halaman "yang harus dilakukan" yang akan mereka jelajahi selanjutnya. Perayap web akan melanjutkan ini tanpa batas, mengikuti aturan tertentu tentang laman mana yang harus dirayapi dan mana yang diabaikan.
Perayap web tidak merayapi setiap halaman di internet. Faktanya, diperkirakan hanya 40-70% dari internet yang telah diindeks pencarian (yang masih miliaran halaman). Banyak perayap web dirancang untuk fokus pada halaman yang dianggap lebih “berwibawa.” Berwibawa halaman sesuai dengan beberapa kriteria yang membuatnya lebih cenderung berisi konten berkualitas tinggi atau populer informasi. Perayap web juga perlu mengunjungi kembali laman secara konsisten saat diperbarui, dihapus, atau dipindahkan.
Salah satu faktor terakhir yang mengontrol halaman mana yang akan dirayapi perayap web adalah protokol robots.txt atau protokol pengecualian robot. Server halaman web akan meng-host file robots.txt yang menjabarkan aturan untuk perayap web atau program lain yang mengakses halaman. File akan mengesampingkan halaman tertentu agar tidak dirayapi dan tautan mana yang dapat diikuti perayap. Salah satu tujuan dari file robots.txt adalah untuk membatasi ketegangan yang dilakukan bot pada server situs web.
Untuk mencegah perayap web mengakses halaman tertentu di situs web Anda, Anda dapat menambahkan tag “larang” melalui file robots.txt atau tambahkan noindex tag meta ke halaman yang dimaksud.
Apa Perbedaan Antara Merangkak dan Menggores?
Pengikisan web adalah penggunaan bot untuk mengunduh data dari situs web tanpa izin situs web tersebut. Seringkali, pengikisan web digunakan untuk alasan jahat. Scraping web sering kali mengambil semua kode HTML dari situs web tertentu, dan scraper yang lebih canggih juga akan mengambil elemen CSS dan JavaScript. Alat pengikis web dapat digunakan untuk mengumpulkan informasi tentang topik tertentu dengan cepat dan mudah (misalnya, daftar produk) tetapi juga dapat menjelajahi wilayah abu-abu dan ilegal.
Perayapan web, di sisi lain, adalah pengindeksan informasi di situs web dengan izin sehingga dapat muncul dengan mudah di mesin pencari.
Contoh Perayap Web
Setiap mesin pencari utama memiliki satu atau lebih web crawler. Contohnya:
- Google memiliki Googlebot
- Bing punya Bingbot
- DuckDuckGo memiliki DuckDuckBot.
Mesin pencari yang lebih besar seperti Google memiliki bot khusus untuk fokus yang berbeda, termasuk Gambar Googlebot, Video Googlebot, dan AdsBot.
Bagaimana Perayapan Web Mempengaruhi SEO?
Jika Anda ingin halaman Anda muncul di hasil mesin pencari, halaman tersebut harus dapat diakses oleh perayap web. Bergantung pada server situs web Anda, Anda mungkin ingin mengalokasikan frekuensi perayapan tertentu, halaman mana yang akan dipindai oleh perayap, dan seberapa besar tekanan yang dapat mereka berikan pada server Anda.
Pada dasarnya, Anda ingin perayap web mengasah halaman yang berisi konten, tetapi tidak pada halaman seperti pesan terima kasih, halaman admin, dan hasil pencarian internal.
Informasi di Ujung Jari Anda
Menggunakan mesin pencari telah menjadi kebiasaan bagi kebanyakan dari kita, namun kebanyakan dari kita tidak tahu bagaimana cara kerjanya. Perayap web adalah salah satu bagian utama dari mesin pencari yang efektif dan secara efektif mengindeks informasi tentang jutaan situs web penting setiap hari. Mereka adalah alat yang sangat berharga bagi pemilik situs web, pengunjung, dan mesin pencari.
Anda mungkin berpikir pemrogram aplikasi dan pengembang web melakukan pekerjaan yang sama, tetapi itu jauh dari kebenaran. Berikut adalah perbedaan utama antara programmer dan pengembang web.
Baca Selanjutnya
- Teknologi Dijelaskan
- Pencarian web
- Pencarian Google
- Trik Pencarian
Jake Harfield adalah seorang penulis lepas yang tinggal di Perth, Australia. Ketika dia tidak sedang menulis, dia biasanya berada di semak-semak memotret satwa liar setempat. Anda dapat mengunjunginya di www.jakeharfield.com
Berlangganan newsletter kami
Bergabunglah dengan buletin kami untuk kiat teknologi, ulasan, ebook gratis, dan penawaran eksklusif!
Klik di sini untuk berlangganan