Iklan
Apa yang akan Anda katakan jika saya memberi tahu Anda bahwa Anda memiliki alat yang dapat Anda gunakan untuk melakukan terobosan, penelitian yang menghancurkan Bumi? Ya, benar, dan saya akan menunjukkan caranya.
Pemerintah, lembaga akademis, dan organisasi penelitian nirlaba mempublikasikan tabel penuh data ke domain publik. Tanpa ada yang menggunakan informasi ini, nilai sebenarnya tidak akan pernah diketahui. Sayangnya, hanya sedikit orang yang memiliki wawasan, keterampilan atau alat untuk mengambil data dan membuat korelasi menarik antara informasi yang tampaknya tidak terhubung.
Latar Belakang
Banyak penelitian yang saya lakukan untuk blog saya sendiri melibatkan menggali melalui apa yang dikenal sebagai web tak terlihat 12 Mesin Pencari Terbaik untuk Menjelajahi Web yang Tak TerlihatGoogle atau Bing tidak dapat mencari semuanya. Untuk menjelajahi web yang tidak terlihat, Anda perlu menggunakan mesin pencari khusus ini. Baca lebih banyak , untuk mengungkap data yang telah dirilis ke publik, tetapi disembunyikan dari
mesin pencari 5 Mesin Pencari Paling Mahir di Web Baca lebih banyak di dalam database online. Ini adalah web yang dalam TorSearch Bertujuan Untuk Menjadi Google Untuk Web Yang DalamTor adalah layanan tersembunyi dan bagian dari Deep Web. TorSearch adalah mesin pencari anonim baru yang pendirinya Chris MacNaughton ingin membuat "Google of Tor". Baca lebih banyak , dan penuh dengan data berharga. Sangat sering, saya menjumpai halaman web yang dipenuhi dengan beberapa data paling berharga tentang topik yang menjalankan keseluruhan dari data sensus hingga studi epidemiologi penyakit langka. Saya selalu memiliki ide-ide baru tentang cara mencoba dan menghubungkan sumber-sumber data yang berbeda menggunakan berbagai alat - dan salah satu alat paling berharga yang saya temukan adalah Kueri Web di dalam Microsoft Unggul.Menemukan Korelasi Data yang Menarik
Apa yang akan saya tunjukkan kepada Anda hari ini adalah contoh bagaimana Anda dapat menggunakan Excel Web Queries untuk menarik data situs web yang berbeda, dan bagikan satu dengan yang lain untuk mencari korelasi potensial antara data.
Cara memulai latihan seperti ini adalah dengan mengajukan hipotesis yang menarik. Sebagai contoh - untuk menjaga hal-hal menarik di sini - Saya akan secara acak mendalilkan bahwa tingkat autisme meroket di Amerika Serikat disebabkan oleh inokulasi vaksin atau meningkatnya kehadiran medan elektromagnetik di dalam dan sekitar anak-anak, seperti sel telepon. Ini adalah hipotesis gila yang suka Anda temukan di sebagian besar situs web teori konspirasi, tapi itulah yang membuat ini menyenangkan. Jadi mari kita mulai, ya?
Pertama, buka Excel, buka item menu data, dan temukan ikon "Dari Web" di pita menu.
Ini yang akan Anda gunakan untuk mengimpor tabel data yang berbeda dari banyak situs web di luar sana yang telah menerbitkannya.
Mengimpor Data Web ke Excel
Jadi, di masa lalu, Anda harus mencoba menyalin data dari tabel itu di halaman web, menempelkannya ke Excel, dan kemudian menangani semua masalah pemformatan gila yang terlibat dalam melakukan itu. Kerepotan total, dan seringkali itu tidak sebanding dengan sakit kepala. Nah, dengan Excel Web Queries, hari-hari itu hilang. Tentu saja, sebelum Anda dapat mengimpor data, Anda harus mencari Google di Web untuk menemukan data yang Anda butuhkan dalam format tabel. Dalam kasus saya, saya menemukan situs web yang telah menerbitkan statistik Departemen Pendidikan untuk jumlah siswa sekolah negeri AS yang diidentifikasi memiliki autisme. Sebuah meja yang bagus di sana menyediakan angka dari tahun 1994 hingga 2006.
Jadi Anda cukup mengklik "Dari Web", rekatkan URL halaman web di bidang alamat permintaan, dan kemudian gulir ke bawah halaman sampai Anda melihat panah kuning di sebelah tabel dengan data yang ingin Anda impor.
Klik panah sehingga menjadi tanda centang hijau.
Terakhir, beri tahu Excel bidang apa yang ingin Anda tempelkan data tabel ke dalam spreadsheet baru Anda.
Lalu - Voila! Data secara otomatis mengalir langsung ke spreadsheet Anda.
Jadi, dengan tren tingkat autisme sekolah umum dari 1996 - 2006 di tempat, sekarang saatnya untuk mencari vaksinasi dan tren penggunaan ponsel juga.
Untungnya, saya dengan cepat menemukan tren untuk pelanggan ponsel di AS dari tahun 1985 hingga 2012. Data yang sangat baik untuk studi khusus ini. Sekali lagi, saya menggunakan alat Excel Web Query untuk mengimpor tabel itu.
Saya mengimpor tabel itu ke dalam lembaran baru yang bersih. Kemudian, saya menemukan tren vaksinasi untuk persentase anak sekolah yang divaksinasi untuk berbagai penyakit. Saya mengimpor tabel itu menggunakan alat Kueri Web ke lembar ketiga. Jadi, akhirnya, saya memiliki tiga lembar dengan tiga tabel yang diisi dengan data yang tampaknya tidak terhubung yang saya temukan di Web.
Langkah selanjutnya, menggunakan Excel untuk menganalisis data dan mencoba mengidentifikasi korelasi. Di situlah salah satu alat analisis data favorit saya berperan - PivotTable.
Menganalisis Data dalam Excel dengan PivotTable
Yang terbaik adalah membuat PivotTable Anda di lembar kosong baru. Anda ingin menggunakan wizard untuk apa yang akan Anda lakukan. Untuk mengaktifkan panduan PivotTable di Excel, Anda harus menekan Alt-D secara bersamaan hingga jendela notifikasi muncul. Kemudian lepaskan tombol-tombol itu, dan tekan tombol "P". Kemudian, Anda akan melihat wizard muncul.
Di jendela pertama panduan, Anda ingin memilih "Beberapa rentang konsolidasi", yang memungkinkan Anda memilih data dari semua lembar yang telah Anda impor. Dengan melakukan ini, Anda dapat mengkonsolidasikan semua data yang tampaknya tidak terkait itu menjadi satu, sangat mudah diputar. Dalam beberapa kasus, Anda mungkin perlu memijat beberapa data. Sebagai contoh, saya harus memperbaiki bidang "Tahun" di tabel autisme sehingga menunjukkan "1994" bukan "1994-95" - membuatnya sejajar dengan tabel di lembar lain, yang juga memiliki tahun utama bidang.
Bidang umum antara data adalah yang Anda butuhkan untuk mencoba dan menghubungkan informasi, jadi ingatlah ketika Anda mencari di Web untuk data Anda.
Setelah PivotTable selesai dan Anda mendapatkan semua nilai data yang berbeda ditampilkan dalam satu tabel, sekarang saatnya untuk melakukan analisis visual untuk melihat apakah ada koneksi yang jelas yang melompat keluar pada Anda.
Memvisualisasikan Data Adalah Kunci
Memiliki banyak angka dalam sebuah tabel sangat bagus jika Anda seorang ekonom, tetapi cara tercepat dan termudah untuk memilikinya "aha!" saat ketika Anda mencoba mencari koneksi seperti jarum di tumpukan jerami, adalah melalui grafik dan grafik. Setelah PivotChart Anda siap dengan semua set data yang telah Anda kumpulkan, sekarang saatnya untuk membuat grafik Anda. Biasanya grafik garis akan melakukan yang terbaik, tetapi itu tergantung pada data. Ada kalanya diagram batang bekerja lebih baik. Cobalah memahami jenis data apa yang Anda lihat dan perbandingan bentuk apa yang paling baik.
Dalam hal ini, saya melihat data dari waktu ke waktu, jadi grafik garis benar-benar cara terbaik untuk melihat tren selama bertahun-tahun. Memetakan tingkat autisme (hijau) terhadap tingkat vaksinasi yang diperkecil (biru tua), vaksin cacar air (biru muda) dan penggunaan ponsel (ungu), sebuah korelasi aneh tiba-tiba muncul dalam kumpulan data sampel yang saya mainkan dengan.
Anehnya, tren penggunaan ponsel dari tahun 1994 hingga 2006 hampir secara sempurna menyamai kenaikan tingkat autisme selama periode waktu yang sama. Meskipun polanya benar-benar tidak terduga, itu adalah contoh sempurna tentang bagaimana mengikat bersama data yang menarik dapat mengungkapkan petunjuk menarik - memberi Anda wawasan dan motivasi yang lebih besar untuk terus maju dan mencari lebih banyak data yang dapat meningkatkan data Anda hipotesa.
Satu korelasi seperti itu di atas tidak membuktikan apa-apa. Ada banyak tren yang meningkat dari waktu ke waktu - polanya bisa saja kebetulan, tetapi bisa juga menjadi petunjuk penting dalam pencarian berkelanjutan Anda untuk lebih banyak data di Internet. Untungnya, Anda memiliki alat yang kuat yang disebut Excel Web Queries yang akan membuat pencarian itu sedikit lebih mudah.
Kredit Foto: Kevin Dooley melalui photopincc
Ryan memiliki gelar BSc di bidang Teknik Listrik. Dia telah bekerja 13 tahun di bidang teknik otomasi, 5 tahun di bidang TI, dan sekarang adalah seorang Insinyur Aplikasi. Mantan Redaktur Pelaksana MakeUseOf, dia berbicara di konferensi nasional tentang Visualisasi Data dan telah ditampilkan di TV dan radio nasional.