Contoh Regresi Linier

Apa itu Regresi Linear?

Regresi linier adalah teknik pemodelan statistik yang menunjukkan hubungan antara satu variabel dependen dan satu atau lebih variabel independen. Ini adalah salah satu jenis analisis prediktif yang paling umum. Jenis distribusi ini membentuk garis yang disebut regresi linier. Artikel ini akan mengambil contoh analisis regresi linier di Excel.

Untuk melakukan analisis regresi linier, terlebih dahulu kita perlu menambahkan add-in excel Add-in ExcelAdd-in adalah ekstensi yang menambahkan lebih banyak fitur dan opsi ke Microsoft Excel yang sudah ada.Baca lebih lanjut dengan mengikuti langkah-langkahnya.

Klik File – Opsi (Ini akan membuka pop-up Opsi Excel untuk Anda).

Klik Add-in – Pilih ‘Add-in Excel’ dari Kelola Drop-Down di excelKelola Drop-Down Di ExcelDaftar drop-down di excel adalah daftar input yang telah ditentukan sebelumnya yang memungkinkan pengguna untuk memilih opsi.baca lebih lanjut, lalu Klik “Pergi”.

Ini akan membuka pop-up “Add-in”. Select Analysis ToolPakAnalysis ToolPakExcel toolpak analisis data dapat digunakan oleh pengguna untuk melakukan analisis data dan perhitungan penting lainnya. Itu dapat diaktifkan secara manual dari bagian addins pada tab files dengan mengklik manage addins, dan kemudian memeriksa analysis toolpak.baca lebih lanjut, lalu klik “OK.”

Add-in “Analisis Data” akan muncul di bawah tab “Sisipkan”.

Mari kita pahami contoh analisis regresi linier di excel di bawah ini Analisis Regresi Dalam ExcelRegresi dilakukan untuk menentukan hubungan antara dua atau lebih variabel dalam kumpulan data dalam regresi statistik dilakukan dengan beberapa rumus kompleks. Namun, excel telah memberi kami alat untuk analisis regresi. Jadi studinya mengambil taman excel, klik analisis data, lalu analisis regresi di excel.baca selengkapnya.

Contoh Analisis Regresi Linear

Contoh 1

Misalkan kita memiliki penjualan bulanan dan dihabiskan untuk pemasaran selama setahun terakhir. Sekarang, kita perlu memprediksi penjualan di masa mendatang berdasarkan penjualan tahun lalu dan pengeluaran pemasaran.

Bulan	Periklanan	Penjualan
Januari	40937	502729
Februari	42376	507553
Merusak	43355	516885
April	44126	528347
Boleh	45060	537298
Jun	49546	544066
Juli	56105	553664
Agustus	59322	563201
September	59877	568657
Okt	60481	569384
November	62356	573764
Desember	63246	582746

Klik “Analisis Data” di bawah tab “Data” untuk membuka pop-up “Analisis Data” untuk Anda.

Pilih “Regresi” dari daftar dan klik “OK.”

Munculan “Regresi” akan terbuka.

Pilih rentang penjualan $C$1:$C$13 di kotak sumbu Y sebagai variabel dependen, dan $B$1:$B$14 di sumbu X karena belanja iklan adalah variabel independen.

Centang kotak “Label” jika Anda telah memilih header dalam data. Jika tidak, itu akan memberi Anda kesalahan.

Selanjutnya, pilih “Output Range” jika Anda ingin mendapatkan nilai pada rentang tertentu di lembar kerja. Jika tidak, pilih “Lapisan Lembar Kerja Baru”, yang akan menambahkan lembar kerja baru dan memberi Anda hasilnya.

Kemudian, centang kotak “Residuals” dan klik “OK.”

Ini akan menambah lembar kerja dan memberi Anda hasil berikut.

Mari kita pahami outputnya.

Keluaran Ringkasan

Multiple R: Ini mewakili koefisien korelasi. Nilai 1 menunjukkan hubungan positif, dan nilai 0 menunjukkan tidak ada hubungan.

R Square: R SquareR SquareR Squared Rumus menggambarkan kemungkinan terjadinya suatu peristiwa dalam hasil yang diharapkan. Ini adalah “r = n (∑xy) – ∑x ∑y / √ [n* (∑x2 – (∑x)2)] * [n* (∑y2 – (∑y)2)] “, di mana r adalah koefisien Korelasi, n adalah angka dalam kumpulan data yang diberikan, x adalah variabel pertama dalam konteks dan y adalah variabel kedua. read more mewakili koefisien determinasi. Ini memberi tahu Anda persentase poin yang jatuh pada garis regresi Garis Regresi Garis regresi menunjukkan hubungan linier antara variabel dependen pada sumbu y dan variabel independen pada sumbu x. Korelasi dibentuk dengan menganalisis pola data yang dibentuk oleh variabel-variabel tersebut.baca lebih lanjut. 0,49 berarti 49% nilai cocok dengan model

Adjusted R square: Ini disesuaikan R squareAdjusted R SquareAdjusted R Squared mengacu pada alat statistik yang membantu investor dalam mengukur sejauh mana varian variabel yang bergantung yang dapat dijelaskan dengan variabel independen dan mempertimbangkan dampak dari hanya variabel independen yang berdampak pada variasi variabel dependen.Baca lebih lanjut, yang mengharuskan Anda memiliki lebih dari satu variabel X.

Kesalahan Standar: Ini mewakili perkiraan standar deviasi kesalahan. Ini adalah ketepatan koefisien regresi yang diukur.

Pengamatan: Ini adalah jumlah pengamatan yang telah Anda ambil dalam sampel.

ANOVA – Df: Degrees of freedomDegrees Of FreedomDegrees of freedom (df) mengacu pada jumlah nilai independen (variabel) dalam sampel data yang digunakan untuk menemukan bagian informasi yang hilang (tetap) tanpa melanggar batasan apa pun yang diberlakukan dalam sistem dinamis. Nilai nominal ini memiliki kebebasan untuk bervariasi, sehingga memudahkan pengguna untuk menemukan nilai yang tidak diketahui atau hilang dalam sebuah dataset.baca lebih lanjut

SS: Jumlah Kuadrat.

MS: kami memiliki dua MS

Regresi MS adalah Regresi SS/Regresi Df.
Residual MS adalah mean squared error (Residual SS / Residual Df).

F: Uji F untuk hipotesis nol Hipotesis Nol Hipotesis nol menganggap bahwa data sampel dan data populasi tidak memiliki perbedaan atau dengan kata sederhana, itu menganggap bahwa klaim yang dibuat oleh orang tersebut pada data atau populasi adalah kebenaran mutlak dan selalu benar. Jadi, meskipun sampel diambil dari populasi, hasil yang diperoleh dari studi sampel tersebut akan sama dengan asumsi.read more.

Signifikansi F: Nilai-P yang terkait dengan Signifikansi

Koefisien: Koefisien memberi Anda estimasi kuadrat terkecil.

Statistik T: Statistik T untuk hipotesis nol vs. hipotesis alternatif.

Nilai-P: Ini adalah nilai-p untuk uji hipotesis.

Lebih Rendah 95% dan Atas 95%: Ini adalah batas bawah dan batas atas untuk interval kepercayaan Interval Keyakinan Interval Keyakinan mengacu pada tingkat ketidakpastian yang terkait dengan statistik tertentu & sering digunakan bersama dengan Margin of Error. Interval Keyakinan = Rata-Rata Sampel ± Faktor Kritis × Standar Deviasi Sampel. Baca selengkapnya

Keluaran Residu.: Kami memiliki 12 pengamatan berdasarkan data. Kolom kedua mewakili penjualan “Diprediksi”, dan kolom ketiga adalah “Sisa”. Residu adalah selisih penjualan yang diprediksi dari yang sebenarnya.

Contoh #2

Pilih kolom prediksi penjualan dan pemasaran.

Buka grup bagan di bawah tab “Sisipkan”. Selanjutnya, pilih ikon bagan “Menyebarkan”.

Ini akan menyisipkan scatter plot di excelInsert The Scatter Plot Di ExcelScatter plot di excel adalah jenis grafik dua dimensi untuk mewakili data, ia memiliki berbagai nama seperti grafik XY atau diagram Scatter di excel, dalam bagan ini kita memiliki dua set data di Sumbu X dan Y yang saling terkait satu sama lain, bagan ini banyak digunakan dalam studi korelasi dan studi regresi data.baca lebih lanjut. Lihat gambar di bawah ini.

Klik kanan pada titik mana saja, lalu pilih Add Trendline in excelTrendline Di ExcelGaris tren, sering dikenal sebagai garis paling pas, menggambarkan tren data. Ini menunjukkan keseluruhan tren, pola, atau arah berdasarkan titik data yang tersedia.baca lebih lanjut. Ini akan menambahkan garis tren ke bagan Anda.

Anda dapat memformat garis tren dengan mengklik kanan di mana saja pada garis tren, lalu memilih format garis tren.
Anda dapat membuat lebih banyak perbaikan pada bagan. yaitu, memformat garis tren, warna dan mengubah judul, dll.
Anda juga dapat menampilkan rumus pada grafik dengan mencentang rumus pada grafik dan menampilkan nilai R-kuadrat.

Beberapa Contoh Analisis Regresi Linear Lainnya:

Prediksi payung yang dijual berdasarkan curah hujan yang terjadi di daerah tersebut.
Prediksi AC terjual berdasarkan suhu di musim panas.
Selama musim ujian, penjualan alat tulis, pada dasarnya penjualan panduan ujian, meningkat.
Prediksi penjualan saat pemasangan iklan dilakukan berdasarkan serial TRP yang tinggi tempat pemasangan iklan, popularitas brand ambassador, dan langkah kaki di tempat penyelenggaraan tempat pemasangan iklan.
Penjualan rumah berdasarkan lokalitas, luas, dan harga.

Contoh #3

Misalkan kita memiliki sembilan siswa dengan tingkat IQ mereka dan angka yang mereka nilai pada Tes.

Siswa	Skor Tes	IQ
Ram	100	145
malu	97	140
Kul	93	130
Kappu	91	125
Raju	89	115
Vishal	86	110
Vivek	82	100
Vinay	78	95
Kumar	75	90

Langkah 1: Pertama, cari tahu variabel dependen dan independen. Di sini, skor tes adalah variabel dependen, dan IQ adalah variabel independen, karena skor tes bervariasi seiring perubahan IQ.

Langkah 2: Buka Tab Data – Klik Analisis Data – Pilih regresi – klik “OK.”

Ini akan membuka jendela “Regresi” untuk Anda.

Langkah 3. Masukkan rentang skor tes di kotak “Input Y Range” dan IQ di kotak Input X Range. (Periksa “Label” jika Anda memiliki tajuk di rentang data Anda. Pilih opsi keluaran, lalu periksa residu yang diinginkan. Klik “OK.”)

Anda akan mendapatkan hasil ringkasan yang ditunjukkan pada Gambar di bawah ini.

Langkah 4: Menganalisis regresi dengan output ringkasan.

Keluaran Ringkasan

Multiple R: Di sini, koefisien korelasinya adalah 0,99, yang sangat dekat dengan 1, yang berarti hubungan liniernya sangat positif.

R Square: Nilai R-Square adalah 0,983, yang berarti bahwa 98,3% nilai cocok dengan model.

Nilai-P: Di sini, nilai-P adalah 1,86881E-07, yang sangat kurang dari 0,1, yang berarti IQ memiliki nilai prediksi yang signifikan.

Lihat grafik di bawah ini.

Anda dapat melihat bahwa hampir semua titik berada dalam garis atau garis tren terdekat.

Contoh #4

Kita perlu memprediksi penjualan AC berdasarkan penjualan dan temperatur untuk bulan yang berbeda.

Bulan	Suhu	Penjualan
Januari	25	38893
Februari	28	42254
Merusak	31	42845
April	33	47917
Boleh	37	51243
Jun	40	69588
Juli	38	56570
Agustus	37	50000

Ikuti langkah-langkah di bawah ini untuk mendapatkan hasil regresi.

Langkah 1: Pertama, cari tahu variabel dependen dan independen. Penjualan adalah variabel dependen, dan suhu adalah variabel independen karena penjualan bervariasi seiring perubahan Temp.

Langkah 2: Buka tab “Data” – Klik “Analisis Data” – Pilih “Regresi”, – klik “OK”.

Ini akan membuka jendela regresi untuk Anda.

Langkah 3. Masukkan sales di kotak ‘Input Y Range’ dan Temp di kotak ‘Input X Range’. (Periksa ‘Label’ jika Anda memiliki tajuk di rentang data Anda. Pilih opsi keluaran, lalu periksa Residual yang diinginkan. Klik Ok.

Ini akan memberi Anda output ringkasan seperti di bawah ini.

Langkah 4: Analisis hasilnya.

Multiple R: Di sini, koefisien korelasinya adalah 0,877, mendekati 1, yang berarti hubungan LinierHubungan LinierHubungan linier menggambarkan hubungan antara dua variabel berbeda – x dan y – dalam bentuk garis lurus pada grafik. Saat menghadirkan hubungan linier melalui persamaan, nilai y diturunkan melalui nilai x, yang mencerminkan korelasinya.baca lebih lanjut positif.

R Square: Nilai R-Square adalah 0,770, yang berarti bahwa 77% nilai cocok dengan model.

Nilai-P: Di sini, nilai-P adalah 1,86881E-07, yang sangat kurang dari 0,1, yang berarti IQ memiliki nilai prediksi yang signifikan.

Contoh #5

Sekarang, mari kita lakukan analisis regresi untuk beberapa variabel independen:

Pertama, Anda perlu memprediksi penjualan ponsel yang akan diluncurkan tahun depan. Kemudian, Anda memiliki harga dan populasi negara yang memengaruhi penjualan ponsel.

Ikuti langkah-langkah di bawah ini untuk mendapatkan hasil regresi.

Versi Seluler	Penjualan	Kuantitas	Populasi
KITA	63860	858	823
Inggris	61841	877	660
KZ	60876	873	631
CH	58188	726	842
HN	52728	864	573
AU	52388	680	809
Selandia Baru	51075	728	661
RU	49019	689	778

Langkah 1. Pertama, cari tahu variabel dependen dan independen. Di sini, penjualan adalah variabel dependen, seperti kuantitas dan populasi. Keduanya adalah variabel independen karena penjualan bervariasi dengan jumlah dan populasi negara.

Langkah 2. Buka tab “Data” – Klik “Analisis Data” – Pilih ‘Regresi’ – klik “OK.”

Ini akan membuka jendela regresi untuk Anda.

Langkah 3. Masukkan penjualan di kotak “Input Y Range” dan pilih jumlah dan populasi di kotak “Input X Range”. (Periksa “Label” jika Anda memiliki header di rentang data Anda. Pilih opsi keluaran, lalu periksa residu yang diinginkan. Klik “OK.”

Jalankan regresi menggunakan analisis data di bawah tab “Data”. Ini akan memberi Anda hasil di bawah ini.

Keluaran Ringkasan

Multiple R: Di sini, koefisien korelasiKoefisien KorelasiKoefisien Korelasi, kadang-kadang dikenal sebagai koefisien korelasi silang, adalah ukuran statistik yang digunakan untuk mengevaluasi kekuatan hubungan antara 2 variabel. Nilainya berkisar dari -1.0 (korelasi negatif) hingga +1.0 (korelasi positif). read more adalah 0,93, yang sangat dekat dengan 1, yang berarti hubungan Liniernya sangat positif.

R Square: Nilai R-Square adalah 0,866, yang berarti 86,7% nilai cocok dengan model.

Signifikansi F: Signifikansi F lebih kecil dari 0,1 yang berarti bahwa persamaan regresi memiliki nilai prediksi yang signifikan.

P-Value : Jika Anda melihat P-value untuk kuantitas dan populasi, Anda dapat melihat bahwa nilainya kurang dari 0,1, yang berarti kuantitas dan populasi memiliki nilai prediksi yang signifikan. Nilai-P yang lebih sedikit berarti bahwa suatu variabel memiliki nilai prediksi yang lebih signifikan.

Namun, kuantitas dan populasi memiliki nilai prediksi yang signifikan. Namun, jika Anda melihat nilai-P untuk kuantitas dan populasi, Anda dapat melihat bahwa kuantitas memiliki nilai-P yang lebih rendah dalam nilai-P excel. Dalam Nilai-ExcelP, atau Nilai Probabilitas, adalah faktor penentu pada hipotesis nol untuk probabilitas hasil yang dianggap benar, diterima atau ditolak, & penerimaan hasil alternatif dalam kasus penolakan hasil yang diasumsikan. membaca lebih dari populasi. Ini berarti kuantitas memiliki nilai prediksi yang lebih signifikan daripada populasi.

Hal-hal untuk diingat

Setiap kali seseorang memilih data, seseorang harus selalu memeriksa variabel dependen dan independen.
Analisis regresi linier mempertimbangkan hubungan antara rata-rata variabel.
Itu hanya memodelkan hubungan antara variabel linier.
Terkadang, ini bukan yang paling cocok untuk masalah dunia nyata. Contoh: (umur dan upah). Sebagian besar waktu, upah meningkat seiring bertambahnya usia. Namun, setelah pensiun, usia bertambah tetapi upah menurun.

Artikel yang Direkomendasikan

Artikel ini telah menjadi panduan untuk Regresi Linier dan definisinya. Di sini, kami membahas cara melakukan analisis regresi linier di Excel dengan bantuan contoh dan lembar Excel yang dapat diunduh. Anda dapat mempelajari lebih lanjut tentang Excel dari artikel berikut: –