Lompat ke konten Lompat ke sidebar Lompat ke footer

Analisis Regresi Linier Sederhana di Software R / R Studio

Regresi linier sederhana adalah teknik statistik yang digunakan untuk mempelajari hubungan antara dua variabel. Dalam regresi linier sederhana, kita mencari hubungan antara variabel independen (x) dan variabel dependen (y) dengan menggunakan garis lurus terbaik yang meminimalkan jarak antara titik data dan garis lurus. Dalam artikel ini, kita akan membahas tata cara melakukan regresi linier sederhana menggunakan software R/R Studio.

Outline Artikel

Regresi Linier Sederhana di Software R/R Studio

R adalah bahasa pemrograman open-source yang populer di kalangan ilmuwan data dan statistikawan. R Studio adalah lingkungan pengembangan terintegrasi (IDE) yang memudahkan penggunaan R. Regresi linier sederhana dapat dilakukan dengan mudah menggunakan package stats yang sudah terintegrasi dalam R.

Dalam tutorial ini, akan dibahas langkah-langkah untuk melakukan analisis regresi linier sederhana menggunakan R Studio. Tutorial ini akan membantu pembaca untuk memahami cara menggunakan R Studio untuk membuat model regresi linier sederhana, menginterpretasikan output dari model tersebut, dan melakukan analisis statistik untuk mengevaluasi keakuratan model regresi.

Melalui tutorial ini, diharapkan pembaca dapat memperluas pengetahuan dan keterampilan analisis data mereka dengan menggunakan R Studio untuk melakukan analisis regresi linier sederhana. Tutorial ini juga dapat memberikan wawasan dan pemahaman yang lebih baik mengenai penggunaan R Studio dalam analisis data, sehingga pembaca dapat memanfaatkannya untuk tujuan bisnis, akademik, dan penelitian."

Langkah-langkah Regresi Linier Sederhana di Software R/R Studio

Berikut adalah langkah-langkah untuk melakukan regresi linier sederhana di R/R Studio:

Import Data

Pertama-tama, impor data yang ingin dianalisis. Data dapat diimpor dalam berbagai format seperti .csv, .txt, .xlsx, atau .rds. Jika data sudah berada dalam format yang sesuai, kita dapat menggunakan fungsi read.csv(), read.table(), read.xlsx(), atau readRDS() untuk memuat data.

Visualisasi Data

Setelah data diimpor, periksa dan visualisasikan data tersebut menggunakan scatter plot atau histogram. Hal ini penting untuk memeriksa apakah data kita berdistribusi normal atau tidak.

Regresi Linier Sederhana

Lakukan regresi linier sederhana dengan menggunakan fungsi lm(). Fungsi ini akan membentuk garis lurus terbaik yang meminimalkan jarak antara titik data dan garis lurus.

Analisis Hasil Regresi

Setelah melakukan regresi linier sederhana, kita dapat menganalisis hasil regresi dengan menggunakan fungsi summary(). Fungsi ini akan memberikan informasi tentang koefisien regresi, intercept, nilai p, dan lain-lain.

Plot Regresi

Terakhir, plot garis regresi menggunakan fungsi plot() dan abline().

 

Output Analisis Regresi Linier Sederhana

Output analisis regresi linier sederhana dapat memberikan informasi tentang kualitas model dan signifikansi hubungan antara variabel independen dan dependen. Beberapa output yang umum ditemukan dalam analisis regresi linier sederhana adalah:

Koefisien Regresi (slope): Menunjukkan seberapa besar perubahan nilai variabel dependen ketika nilai variabel independen berubah satu satuan.

Intercept: Menunjukkan nilai dari variabel dependen ketika nilai variabel independen sama dengan nol.

R-squared: Menunjukkan seberapa baik model kita cocok dengan data. Nilai r-squared berkisar antara 0 dan 1, dengan nilai yang lebih tinggi menunjukkan model yang lebih baik.

Nilai p: Menunjukkan signifikansi hubungan antara variabel independen dan dependen. Nilai p yang rendah menunjukkan bahwa hubungan antara variabel independen dan dependen adalah signifikan secara statistik.

Contoh Kasus

Soal

Contoh kasus yang digunakan adalah untuk menganalisis hubungan antara curah hujan dengan penjualan payung. Curah hujan dijadikan variabel bebas (X) dan penjualan payung dijadikan variabel terikat (Y). Tujuan analisis ini adalah untuk mengetahui seberapa besar pengaruh curah hujan terhadap penjualan payung.

Curah Hujan (X)

Penjualan Payung (Y)

3.2

20

4.5

25

2.1

15

5.7

30

6.3

35

2.8

18

4.1

24

5.5

32

1.9

12

3.8

22

4.6

26

2.5

16

6.1

36

3.6

21

5.2

28

2.3

14

3.9

23

4.8

27

2.9

19

6.5

38

5.4

31

4.4

25

3.5

20

2.2

14

5.8

33

3.3

19

4.9

28

6.2

36

2.7

17

4.3

24

Solusi

Contoh kasus yang digunakan adalah untuk menganalisis hubungan antara curah hujan dengan penjualan payung. Curah hujan dijadikan variabel bebas (X) dan penjualan payung dijadikan variabel terikat (Y). Tujuan analisis ini adalah untuk mengetahui seberapa besar pengaruh curah hujan terhadap penjualan payung.

Langkah-langkah untuk melakukan analisis regresi linier sederhana di R/R Studio adalah sebagai berikut:

Memasukkan data ke dalam R/R Studio

Pertama, kita perlu memasukkan data curah hujan dan penjualan payung ke dalam R/R Studio. Untuk melakukan hal ini, kita dapat menulis script berikut:

> curah_hujan <- c(3.2, 4.5, 2.1, 5.7, 6.3, 2.8, 4.1, 5.5, 1.9, 3.8, 4.6, 2.5, 6.1, 3.6, 5.2, 2.3, 3.9, 4.8, 2.9, 6.5, 5.4, 4.4, 3.5, 2.2, 5.8, 3.3, 4.9, 6.2, 2.7, 4.3)

> penjualan_payung <- c(20, 25, 15, 30, 35, 18, 24, 32, 12, 22, 26, 16, 36, 21, 28, 14, 23, 27, 19, 38, 31, 25, 20, 14, 33, 19, 28, 36, 17, 24)

Selain itu, jika data sudah disimpan dalam suatu file, missal excel, maka bisa mengimport dengan script berikut (warna merah melupakan lokasi folder file)

> library(readxl)

> Data1 <- read_excel("C:/Users/Data/Folder/Data1.xlsx")

Visualisasi Data

Setelah memasukkan data, kita dapat memvisualisasikan data menggunakan plot. Hal ini dapat dilakukan dengan menggunakan script berikut:

> plot(curah_hujan, penjualan_payung, main = "Hubungan antara Curah Hujan dan Penjualan Payung", xlab = "Curah Hujan (mm)", ylab = "Penjualan Payung")

Melakukan Regresi Linier Sederhana

Setelah memvisualisasikan data, langkah selanjutnya adalah melakukan regresi linier sederhana. Kita dapat melakukan regresi linier sederhana dengan menggunakan fungsi lm(). Scriptnya adalah sebagai berikut:

> model_regresi <- lm(penjualan_payung ~ curah_hujan)

> summary(model_regresi)

Output Soal Regresi Linier Sederhana

Setelah script telah selesai di running / di jalankan, berikut adalah contoh output dari analisis regresi linier sederhana menggunakan Software R/R Studio:

Interpretasi Output

Output tersebut merupakan hasil regresi linier sederhana antara variabel penjualan_payung dan curah_hujan. Berikut adalah interpretasi dari setiap bagian output:

Call

Berisi informasi tentang fungsi yang digunakan untuk melakukan analisis regresi linier sederhana. Dalam hal ini, fungsi lm() digunakan untuk memodelkan penjualan_payung sebagai fungsi dari curah_hujan.

Residuals

Merupakan selisih antara nilai observasi aktual dan nilai prediksi yang dihasilkan oleh model regresi. Output ini memberikan informasi tentang sebaran data residual, yang harus sekitar 0 dengan variansi yang homogen.

Coefficients

Merupakan estimasi koefisien regresi. Pada bagian ini terdapat informasi tentang intercept (konstanta) dan koefisien regresi dari variabel curah_hujan. Perhatikan bahwa koefisien curah_hujan memiliki nilai 5.1992, yang artinya setiap peningkatan satu unit curah_hujan akan meningkatkan penjualan_payung sebesar 5.1992.

Signif. codes

Mencantumkan informasi tentang signifikansi statistik dari koefisien regresi. Pada output ini, koefisien intercept memiliki tanda asterisk (*) satu di belakangnya, yang berarti signifikan secara statistik pada level signifikansi 0.05. Sementara koefisien curah_hujan memiliki tanda asterisk tiga di belakangnya, yang artinya sangat signifikan secara statistik.

Residual standard error

Mengukur seberapa jauh prediksi model regresi dari nilai observasi aktual. Semakin kecil nilai ini, semakin dekat prediksi model dengan nilai observasi aktual.

Multiple R-squared

Mengukur seberapa besar variasi dari variabel penjualan_payung yang dapat dijelaskan oleh variabel curah_hujan. Pada output ini, nilai R-square sebesar 0.9835, yang artinya 98.35% variansi penjualan_payung dapat dijelaskan oleh variabel curah_hujan.

Adjusted R-squared

Mengukur seberapa besar variasi dari variabel penjualan_payung yang dapat dijelaskan oleh variabel curah_hujan setelah mempertimbangkan jumlah parameter dalam model. Semakin dekat nilai adjusted R-squared dengan nilai R-squared, semakin baik model tersebut.

F-statistic

Mengukur signifikansi secara keseluruhan dari model regresi. Pada output ini, nilai F-statistic sebesar 1665 dan p-value kurang dari 2.2e-16, yang artinya model regresi tersebut signifikan secara statistik.

Model Regresi Linier Sederhana

Model regresi linier sederhana dari output di atas adalah:

y = 2.6033 + 5.1992x

Di mana y adalah variabel terikat (penjualan_payung) dan x adalah variabel bebas (curah_hujan).

Interpretasi dari model regresi ini adalah sebagai berikut:

Intercept (a) adalah nilai y ketika variabel x bernilai nol, dalam hal ini adalah 2.6033. Ini berarti bahwa ketika curah hujan sama dengan nol, penjualan payung diperkirakan sebesar 2.6033.

Coefficient (b) adalah besarnya perubahan y yang diharapkan ketika x (curah_hujan) mengalami perubahan satu satuan, dalam hal ini adalah 5.1992. Ini berarti bahwa setiap kenaikan satu satuan pada curah hujan, diperkirakan akan meningkatkan penjualan payung sebesar 5.1992 unit.

Koefisien determinasi (R-squared) menunjukkan seberapa baik model ini dapat menjelaskan variasi dalam data, dalam hal ini adalah 0.9835. Ini berarti sekitar 98.35% variasi dalam data penjualan payung dapat dijelaskan oleh curah hujan.

P-value (nilai p) menunjukkan signifikansi dari masing-masing koefisien dalam model. Dalam hal ini, kedua koefisien (intercept dan curah_hujan) memiliki nilai p yang sangat rendah, kurang dari 0.05, sehingga keduanya signifikan secara statistik dan dapat dipercaya.

Berdasarkan interpretasi di atas, dapat disimpulkan bahwa model regresi linier sederhana antara variabel penjualan_payung dan curah_hujan tersebut cukup baik, karena memiliki nilai R-squared yang cukup tinggi dan koefisien curah_hujan yang signifikan secara statistik.

Kesimpulan

Artikel ini membahas tentang regresi linier sederhana dan bagaimana melakukan analisis regresi linier sederhana menggunakan software R/R Studio. Langkah-langkah untuk melakukan analisis meliputi impor data, visualisasi data, melakukan regresi linier sederhana, analisis hasil regresi, dan plot regresi. Output analisis regresi linier sederhana yang umum ditemukan adalah koefisien regresi, intercept, R-squared, dan nilai p. Artikel ini juga memberikan contoh kasus tentang analisis hubungan antara curah hujan dan penjualan payung. Diharapkan artikel ini dapat membantu pembaca memperluas pengetahuan dan keterampilan analisis data mereka dengan menggunakan R Studio untuk melakukan analisis regresi linier sederhana.

Posting Komentar untuk "Analisis Regresi Linier Sederhana di Software R / R Studio"