Isu-Isu Di Regresi Linier
Regresi adalah suatu model yang merelasikan variabel terikat (response variable) dan variable-variabel bebas (regressor variables). Apabila jumlah variabel bebasnya berjumlah satu, maka model regresinya disebut regresi linier sederhana. Sedangkan regresi linier majemuk (Multiple Linear Regression) adalah salah satu teknik multivariat yang digunakan untuk mengestimasi hubungan antara satu variabel terikat dengan beberapa variabel bebas. Sudah banyak aplikasi regresi linier di berbagai bidang seperti teknik, ekonomi, lingkungan, social dan sebagainya.
Namun demikian ada beberapa isu yang perlu diperhatikan pada analisa regresi linier sebagai berikut:
- LINEARITAS: Sebagian besar masalah dunia nyata memiliki hubungan non-linier antara variabel terikat dengan variabel-variabel bebasnya..
- COLLINEARITY/MULTICOLLINEARITY: Keberadaan collinearity/multicollinearity akan mempunyai efek negatif pada kemampuan prediksi dan hypothesis testing pada regresi yang dibuat berdasarkan ordinary least squares (OLS).
- OUTLIERS: prediksi regresi berbasis OLS akan terdistorsi saat outlier hadir karena residu kuadrat memperbesar efek outlier.
- DATA BESAR: Algoritma regresi yang ada mungkin kurang menghasilkan model regresi dengan waktu pembelaharan yang wajar.
- TIME SERIES: Beberapa dataset membutuhkan model regresi deret waktu.
- DATA FUZZY: Membutuhkan model regresi yang melibatkan pemahaman fuzzy set serta fungsi membership-nya.