Saat menggunakan Google Sheets untuk bekerja dengan dua kumpulan data, Anda mungkin ingin membandingkan keduanya dengan menentukan sejauh mana pengaruh yang satu terhadap yang lain.
Korelasi dapat menawarkan wawasan tentang apakah ada hubungan prediktif antara bidang x dan y, tetapi tidak selalu menunjukkan kausalitas. Inilah cara Anda dapat menggunakan Google Sheets untuk mengidentifikasi korelasi dalam data Anda.
Apa Itu Korelasi, dan Untuk Apa Anda Dapat Menggunakannya?
Ketika dua variabel berkorelasi, seseorang dapat menentukan bagaimana suatu variabel memengaruhi yang lain. Namun, penting untuk diingat bahwa korelasi tidak menyiratkan ketergantungan dalam kasus ini; itu hanya menunjukkan seberapa dekat dan cepat dua variabel membandingkan atau berhubungan.
Metrik statistik membantu dalam pemahaman tren yang mendasari analisis data. Korelasi adalah salah satu metrik statistik yang paling sering digunakan, dan ini menentukan seberapa dekat hubungan atau ketergantungan dua variabel.
Memahami Koefisien Korelasi di Google Sheets
Di Google Sheets, koefisien korelasi dihitung menggunakan fungsi CORREL. Koefisien korelasi berfungsi sebagai ukuran seberapa erat hubungan kumpulan data tersebut. Ini dapat digunakan untuk mendapatkan koefisien korelasi momen-produk Pearson (r) jika Anda memiliki dua kumpulan data variabel. Jika Anda ingin mempelajari lebih lanjut tentang koefisien ini, Anda dapat membaca lebih lanjut di panduan ini dari Statistik di Leard.
Seseorang dapat menemukan salah satu dari tiga metrik korelasi. Setiap pengukuran mendefinisikan hubungan antar variabel secara berbeda. Nilainya antara -1 dan +1:
- -1 menunjukkan korelasi negatif sempurna: Ketika korelasi memang memiliki koefisien korelasi yang sama dengan atau di bawah -0,9, itu dinyatakan sangat negatif. Ini merupakan indikasi bahwa data berkorelasi. Namun variabel x terus meningkat, sedangkan variabel y terus menurun.
- 0 menunjukkan tidak ada koneksi: Variabel dianggap tidak berkorelasi jika koefisien korelasi lebih besar dari 0,01 tetapi kurang dari 0,1 karena tidak ada hubungan yang terlihat antara masing-masing variabel. Mereka independen satu sama lain.
- +1 menunjukkan korelasi positif sempurna: Ketika koefisien korelasi turun antara 0,9 dan 1, itu dianggap sangat positif. Hal ini menunjukkan bahwa telah terjadi peningkatan pada kedua himpunan variabel tersebut.
Nilai koefisien tertinggi mungkin merupakan koefisien korelasi 1. Ketika nilai korelasi adalah 1, ini menyiratkan bahwa jika Anda membuat grafik data, itu akan benar-benar selaras untuk membuat garis lurus.
Jika Anda masih sedikit tersesat, jangan khawatir. Kami akan menjelaskan sintaks fungsi CORREL dan kemudian menyelami beberapa contoh dunia nyata untuk membantu Anda memahaminya dengan lebih baik. Memahami garis yang paling cocok dan cara membuat trendline di Google Sheets akan membantu Anda dengan ini.
Sintaks Fungsi CORREL di Google Sheets
=CORREL(data_y, data_x)
Mari kita pecahkan ini menjadi beberapa bagian dan lebih memahami apa arti setiap frasa:
- =KOREL: Ini adalah fungsi Google Sheet yang menentukan r, (koefisien korelasi momen produk Pearson dari kumpulan data).
- data_y: Ini mengacu pada grup sel yang berisi data dependen atau rentang nilai untuk sel tersebut.
- data x: Ini bisa berupa referensi ke larik sel dengan data independen atau rentang nilai untuk sel tersebut.
Jika Anda membuat grafik titik data, data_y akan menjadi sumbu Y dan data_x sumbu X. Anda akan melihat bahwa ada dua cara berbeda untuk memasukkan rentang data. Baik rentang sel referensi atau entri data langsung dalam fungsi adalah opsi.
Dalam kebanyakan kasus, penggunaan rentang sel referensi lebih disukai. Itu karena spreadsheet kemungkinan besar sudah berisi data Anda. Menggunakan rentang sel referensi dapat menghindari masukan yang diketik berlebihan yang dapat mengakibatkan kesalahan pengguna.
Contoh Fungsi CORREL di Google Sheets
Mari kita lihat beberapa contoh untuk memahami cara menggunakan fungsi CORREL di Google Sheets.
Contoh 1: Korelasi Positif yang Kuat
Untuk contoh pertama ini, anggaplah kita bekerja di industri real estat. Pada spreadsheet di bawah ini, kami memiliki data partisi hektar tanah yang Anda jual dan jumlah unit yang terjual dari data tanah yang berbeda tersebut di Google Sheet Anda.
- Jika Anda mengikuti dalam sebuah sheet, Anda akan mulai dengan memasukkan data variabel ke dalam spreadsheet Anda, seperti yang ditunjukkan di bawah ini:
- Klik sel C2
- Jenis =KOREL(
- Anda kemudian akan melanjutkan mengetik data_y, yang dalam kasus kami, adalah rentang sel yang direferensikan A2:A6, lalu masukkan koma.
- Lanjutkan untuk mengetik data_x, yang dalam kasus kita, direferensikan sebagai B2:B6.
- Akhiri dengan tanda kurung tutup, seperti yang ditunjukkan di bawah ini:
- Terakhir, tekan Memasuki untuk mengembalikan koefisien korelasi dari dua bagian data dalam sel C2.
Dengan menggunakan contoh yang baru saja ditunjukkan di atas, Anda telah memperoleh koefisien korelasi sebesar 0,90, yang merupakan korelasi positif yang kuat karena nilainya berada di antara 0,9 dan 1. Oleh karena itu, ini menunjukkan bahwa ketika y berubah, x juga berubah secara substansial sebanding.
Di bawah ini adalah representasi dari contoh data sampel kami pada grafik pencar XY. Seperti yang Anda lihat, garis yang paling cocok dekat dengan titik data pada grafik, yang mendukung gagasan bahwa angka tersebut sangat berkorelasi.
Anda dapat mempelajari lebih lanjut tentang membuat grafik pencar XY di Google Sheets di artikel kami yang lain.
Contoh 2: Korelasi Negatif Lemah
Kali ini, kami akan menggunakan contoh yang lebih umum dari "variabel x dan y" di spreadsheet kami. Kami sengaja memasukkan angka untuk menunjukkan korelasi negatif, yang ditunjukkan oleh fungsi CORREL di bawah ini:
Tidak terdapat hubungan yang kuat antara variabel y dan x, sehingga hasil yang didapatkan adalah koefisien korelasi yang kurang signifikan dibandingkan dengan contoh sebelumnya. Hasil yang kami capai adalah -0,47. Namun, ini tidak berarti bahwa tidak ada korelasi sama sekali. Mari kita lihat garis yang paling cocok lagi untuk memahaminya.
Seperti yang Anda lihat dari plot pencar, titik data lebih jauh dari garis yang paling sesuai. Oleh karena itu, ada korelasi yang lebih sedikit daripada pada contoh pertama, tetapi bukan tidak ada. Anda juga akan melihat bahwa garis yang paling cocok menurun. Ini menunjukkan korelasi negatif, satu nilai menurun dengan peningkatan lainnya.
Contoh 3: Tidak Ada Koneksi
Di sini kami memiliki satu set angka yang sepenuhnya acak. Mari kita cepat menyentuh cara menggunakan fungsi CORREL lagi:
- Ketik Sel C2 rumus COREL
- Argumen kami adalah A2:A10 Dan B2:B10
- Tekan Enter
Nilai yang dikembalikan pada C2 adalah 0,02. Jika koefisien korelasi berada di antara 0,01 dan 0,1, ditentukan bahwa variabel-variabel tersebut tidak berkorelasi karena tidak ada hubungan yang terlihat di antara mereka. Hubungan antar variabel sepenuhnya independen.
Di bawah ini adalah representasi yang sama pada grafik pencar. Garis yang paling cocok hampir rata, menunjukkan sedikit korelasi antara dua set data.
Korelasikan Data Anda dengan Mudah di Google Sheets
Korelasi bisa menjadi topik yang menantang jika Anda tidak banyak mengerjakannya di sekolah menengah. Panduan ini mencakup semua dasar-dasarnya, tetapi Anda harus tetap menggunakan fungsi CORREL di Google Sheets agar tetap segar dalam ingatan Anda.
Ini adalah fungsi yang hebat karena membantu menghindari pembuatan grafik pencar dan dapat dengan cepat menemukan tren dalam data Anda. Tetap saja, jangan takut menambahkan bagan untuk membantu pengguna lain lebih memahami data di spreadsheet Anda.