Jumat, 28 Desember 2018

Contoh Soal Regresi Sederhana

        NAMA : RIYAN ASRIF AZIMIN

        NPM : 17 630 090

        KELAS : C

Contoh Soal dan Penyelesaian Regresi Linier Sederhana

Hasil gambar untuk regresi linier sederhana

Contoh :

Memprediksi waktu tempuh pengiriman order jasa laundry. Dalam kasus ini menggunakan analogi perusahaan laundry kelas premium dengan tarif harga bukan perkilo melainkan per-potong(piece) sedangkan kategori pelangganya adalah hotel, home spa , beauty salon, kantor dan para pelanggan kelas premium. Perusahaan melayani jasa laundry meliputi : baju, celana, tas, sepatu, karpet, korden, carpot, jaket , dsb.

Untuk melayani jasa layanan ambil-antar dengan jumlah pelanggan tetap relatif banyak, maka waktu antar layanan laundry menjadi suatu prioritas sebagai cara menghindari komplain pelanggan.

Hal yang harus diketahui seberapa lama layanan akan diantar sampai ketangan pelanggan?. Pegawai memakai mobil untuk mengantarkan jasa layanan antar ambil laundry. Beberapa sample data waktu yang dibutuhkan pegawai untuk mengantarkan laundry sejak dari proses produksi sampai barang diterima pelanggan.

Data tabel waktu pengantaran jasa laundry :

Gunakan rumus :

Berdasar data yang tertera diatas, seandainya, datang pesanan ke-26 dari hotel dengan jarak tempuh 1.5 km dari produksi laundry maka, seharusnya "waktu pengantaran dapat diprediksi". Contoh ini akan digunakan sebagai cara untuk menggambarkan "sebuah kegiatan prediksi data mining"

Bagaimana hubungan sebab-akibat jarak dan waktu tempuh pengantaran jasa laundry? Jarak lokasi pelanggan mengakibatkan panjang-pendeknya waktu tempuh pengiriman barang maka, jarak merupakan variabel pemberi pengaruh sebagai sumbu X(dalamkilometer) dan waktu sebagai variabel teperngaruh sebagai sumbu Y(dalam menit) . Setiap pasang data jarak-waktu digambarkan sebagai titik potong.

Tujuan regresi ini untuk mencari garis lurus sedekat mungkin dengan semua titik untuk mewakili titi-titik tersebut.

Secara rumus persamaan Y = β0 + β1x

Y = Variabel terpengaruh

β0 = Konstanta

β1 = Gradien garis

x = Variabel pemberi pengaruh

Bagaimana cara mencari garis regresi linier yang paling baik?. Untuk mengetahui garis regresi linier yang paling baik diperlukan perhitungan konstanta β0 dan gradien β1 dengan rumus.

Kesimpulan:

Berdasarkan hasil perhitungan rumus regresi linear sederhana diatas maka, diperoleh persamaan Y = 14.58 + 4.35X.

Infomasi apa yang diperoleh dari perhitungan regresi linear sederhana sebagai, prediksi data waktu tempuh ? dengan mengacu hasil nilai Y pada perhitungan regresi linier , maka prediksi jumlah waktu yang dibutuhkan pengiriman jasa laundry 14.58 menit ditambah 4.35 kali jarak pelanggan. Dengan uraian data lebih detail peresamaan garis regresi linear ini menyatakan bahwa bila rumah pelanggan berjarak 0 km dari produksi laundry, waktu antar jasa laundry diprediksi 14.58 menit. Setiap pertambahan jarak sepanjang 1km, maka lama waktu tempuh diprediksi akan bertambah selama 3.58 menit. Untuk menjawab berapa lama waktu tempuh karyawan mengantar pesanan ke-26 dengan jarak tempuh 1.5 km ?

Cara prediksi waktu antar jasa laundry yang dibutuhkan karyawan untuk mengantarkan layanan kepada pelanggan dengan cara

Y= 14.58 + 4.35X

Y = 14.58 + 4.35(1.5) = 21.1 menit

Maka dapat ditarik kesimpulah prediksi pengiriman jasa laundry sampai kelokasi pelanggan dalam waktu 21.1 menit

08 ANALISIS REGRESI SEDERHANA

NAMA : RIYAN ASRIF AZIMIN

NPM : 17 630 090

KELAS : C

Analisis Regresi Sederhana

Analisis Regresi Sederhana adalah sebuah metode pendekatan untuk pemodelan hubungan antara satu variabel dependen dan satu variabel independen. Dalam model regresi, variabel independen menerangkan variabel dependennya. Dalam analisis regresi sederhana, hubungan antara variabel bersifat linier, dimana perubahan pada variabel X akan diikuti oleh perubahan pada variabel Y secara tetap. Sementara pada hubungan non linier, perubahaan variabel X tidak diikuti dengan perubahaan variabel y secara proporsional. seperti pada model kuadratik, perubahan x diikuti oleh kuadrat dari variabel x. Hubungan demikian tidak bersifat linier.

Secara matematis model analisis regresi linier sederhana dapat digambarkan sebagai berikut:

Y = A + BX + e

Y adalah variabel dependen atau respon

A adalah intercept atau konstanta

B adalah koefisien regresi atau slope

e adalah residual atau error

Secara praktis analisis regresi linier sederhana memiliki kegunaan sebagai berikut:

1. Model regresi sederhana dapat digunakan untuk forecast atau memprediksi nilai Y. Namun sebelum melakukan forecasting, terlebih dahulu harus dibuat model atau persamaan regresi linier. Ketika model yang fit sudah terbentuk maka model tersebut memiliki kemampuan untuk memprediksi nilai Y berdasarkan variabel Y yang diketahui. Katakanlah sebuah model regresi digunakan untuk membuat persamaan antara pendapatan (X) dan konsumsi (Y). Ketika sudah diperoleh model yang fit antara pendapatan dengan konsumsi, maka kita dapat memprediksi berapa tingkat konsumsi masyarakat ketika kita sudah mengetahui pendapatan masyarakat.

2. Mengukur pengaruh variabel X terhadap variabel Y. Misalkan kita memiliki satu serial data variabel Y, melalui analisis regresi linier sederhana kita dapat membuat model variabel-variabel yang memiliki pengaruh terhadap variabel Y. Hubungan antara variabel dalam analisis regresi bersifat kausalitas atau sebab akibat. Berbeda halnya dengan analisis korelasi yang hanya melihat hubungan asosiatif tanpa mengetahui apa variabel yang menjadi sebab dan apa variabel yang menjadi akibat.

Model regresi linier sederhana yang baik harus memenuhi asumsi-asumsi berikut:

1. Eksogenitas yang lemah, kita harus memahami secara mendasar sebelum menggunakan analisis regresi bahwa analisis ini mensyaratkan bahwa variabel X bersifat fixed atau tetap, sementara variabel Y bersifat random. Maksudnya adalah satu nilai variabel X akan memprediksi variabel Y sehingga ada kemungkinan beberapa variabel Y. dengan demikian harus ada nilai error atau kesalahan pada variabel Y. Sebagai contoh ketika pendapatan (X) seseorang sebesar Rp 1 juta rupiah, maka pengeluarannya bisa saja, Rp 500 ribu, Rp 600 ribu, Rp 700 ribu dan seterusnya.

2. Linieritas, seperti sudah dijelaskan sebelumnya bahwa model analisis regresi bersifat linier. artinya kenaikan variabel X harus diikuti secara proporsional oleh kenaikan variabel Y. Jika dalam pengujian linieritas tidak terpenuhi, maka kita dapat melakukan transformasi data atau menggunakan model kuadratik, eksponensial atau model lainnya yang sesuai dengan pola hubungan non-linier.

3. Varians error yang konstan, ini menjelaskan bahwa varians error atau varians residual yang tidak berubah-ubah pada respon yang berbeda. asumsi ini lebih dikenal dengan asumsi homoskedastisitas. Mengapa varians error perlu konstan? karena jika konstan maka variabel error dapat membentuk model sendiri dan mengganggu model. Oleh karena itu, penanggulangan permasalahan heteroskedastisitas/non-homoskedastisitas dapat diatasi dengan menambahkan model varians error ke dalam model atau model ARCH/GARCH.

4. Autokorelasi untuk data time series, jika kita menggunakan analisis regresi sederhana untuk data time series atau data yang disusun berdasarkan urutan waktu, maka ada satu asumsi yang harus dipenuhi yaitu asumsi autokorelasi. Asumsi ini melihat pengaruh variabel lag waktu sebelumnya terhadap variabel Y. Jika ada gangguan autokorelasi artinya ada pengaruh variabel lag waktu sebelumnya terhadap variabel Y. sebagai contoh, model kenaikan harga BBM terhadap inflasi, jika ditemukan atukorelasi artinya terdapat pengaruh lag waktu terhadap inflasi. Artinya inflasi hari ini atau bulan ini bukan dipengaruhi oleh kenaikan BBM hari ini namun dipengaruhi oleh kenaikan BBM sebelumnya (satu hari atau satu bulan tergantung data yang dikumpulkan)

Jumat, 21 Desember 2018

07 UJI ANOVA

Nama : RIYAN APRIL ADMIN
NPM : 17 630 090
KELAS : C

UJI ANOVA

Uji Anova adalah bentuk khusus dari analisis statistik yang banyak digunakan dalam penelitian eksperimen. metode analisis ini dikembangkan oleh R.A Fisher. Uji Anova juga adalah bentuk uji hipotesis statistik dimana kita mengambil kesimpulan berdasarkan data atau kelompok statistik inferentif. Hipotesis nol dari uji Anova adalah bahwa data adalahsimple random dari populasi yang sama sehingga memiliki ekspektasi mean dan varians yang sama. Sebagai contoh penelitian perbedaan perlakuan terhadap sampel pasien yang sama. Hipotesis nol nya adalah semua perlakuan akan memiliki efek yang sama.

Meskipun uji t adalah statistik yang sering digunakan, hanya saja uji t dibatasi untuk menguji hipotesis dua kelompok. Uji Anova atau Analisis varians (ANOVA) dikembangkan untuk memungkinkan peneliti untuk menguji hipotesis perbandingan lebih dari dua kelompok. Dengan demikian, uji-t dan uji anova adalah sama-sama metode statistik untuk perbandingan. Yang membedakan keduanya adalah hanya jumlah kelompok yang dibandingkan.

Landasan konseptual ANOVA

Seperti halnya Uji T, dalam uji Anova pun Anda harus menghitung statistik uji (dalam hal ini adalah F- rasio) untuk menguji pernyataan bahwa apakah kelompok yang dibandingkan memiliki kesamaan atau tidak. Bahasa statistik hipotesis uji Anova dapat dituliskan sebagai berikut: H0 : M1 = M2 = M3 = 0 , biasanya dengan harapan bahwa Anda akan dapat menolak H0 untuk memberikan bukti bahwa hipotesis alternatif ( H1 : Tidak H0 ) . Untuk menguji H0, Anda mengambil sampel secara acak kelompok peserta/sampel/responden dan menetapkan ukuran-ukuran (variabel dependen). Kemudian melihat apakah ukuran-ukuran tersebut berbeda berarti untuk berbagai kondisi. Jika berbeda maka Anda akan dituntun untuk menolak H0. Seperti pada uji statistik yang lain, kita menolak H0 ketika mendapati statistik uji yang diukur melalui F-statistik yang melebihi F tabel dengan tingkat kepercayaan tertentu. Cara lain dapat dilakukan dengnan melihat p-value (nilai probabilitas) yang mana lebih rendah dari 5%, misalnya kita menggunakan tingkat kepercayaan 95%.

Prinsip uji Anova adalah kita membandingkan variansi tiga kelompok sampel atau lebih. Lebih dari sekedar membandingkan nilai mean (rata-rata), uji anova juga mempertimbangkan keragaman data yang dimanifestasikan dalam nilai varians.

Apa saja asumsi yang harus dipenuhi dalam uji Anova sebagai bentuk dari model linier, berikut diantaranya:

1. Independensi observasi, setiap observasi dalam analisis anova harus bersifat independen.

2. Normalitas, Residual atau error harus mengikuti distribusi normal.

3. Homogenitas varians, varians antara kelompok yang dibandingkan harus homogen.

Mengingat uji Anova ini banyak digunakan dalam penelitian eksperimen, maka uji anova dapat dibagi berdasarkan desainnya.

1. Anova satu arah, digunakan untuk menguji perbedaan diantara dua atau lebih kelompok dimana hanya terdapat satu faktor yang dipertimbangkan. sebagai contoh membandingkan efek dosis obat yang berbeda terhadap kesembuhan pasien.

2. Anova faktorial, merupakan pengembangan dari anova satu arah dimana ada lebih dari satu faktor dan interaksinya yang dipertimbangkan. Misalnya bukan hanya faktor dosis obat tetapi juga frekuensi pemberian obat. pada anova faktorial, interaksi atau kombinasi diantara faktor juga dipertimbangkan. Pada contoh ini, interaksi antara dosis obat dan frekuensi pemberian obat dapat dihitung pengaruhnya terhadap kesembuhan pasien. Anova dua arah (two way anova) termasuk dalam Anova faktorial.

3. Anova reapeted measures, digunakan ketika dalam desain eksperimen mengijinkan subjek penelitian diikutsertakan pada perlakuan yang berbeda. terkait contoh di atas, misalnya pasien yang sama diberikan obat dengan dosis yang berbeda.

4. Multivariat Anova, berbeda dengan uji Anova yang hanya mengukur satu respon, Manova mengukur lebih dari satu respon dalam satu kali eksperimen. misalnya kita meneliti dampak obat pada beberapa dosis. Respon yang diteliti lebih dari satu misalnya kadar Trigleserida , LDL dan HDL pada pasien.

Jumat, 14 Desember 2018

UJI CHI KUADRAT

NAMA : RIYAN ASRIF AZIMIN

NPM : 17 630 090

KELAS : C

UJI CHI KUADRAT (χ2)

1. Pendahuluan

Chi Kuadrat (χ²) satu sampel adalah teknik statistik yang digunakan untuk menguji hipotesis bila dalam populasi terdiri atas dua atau lebih klas dimana data berbentuk nominal dan sampelnya besar.

Rumus dari Chi Kuadrat adalah seperti rumus 5.4 berikut.

Dimana

χ² = Chi Kuadrat

f_o= Frekuensi yang di observasi

f_h= Frekuensi yang diharapkan

2. Ketentuan Pemakaian Chi-Kuadrat (χ²)

Agar pengujian hipotesis dengan Chi Kuadrat dapat digunakan dengan baik, maka hendaknya memperhatikan ketentuan-ketentuan sebagai berikut :

a. Jumlah sampel harus cukup besar untuk meyakinkan kita bahwa terdapat kesamaan antara distribusi teoritis dengan distribusi sampling Chi Kuadrat.

b. Pengamatan harus bersifat independen (unpaired). Ini berarti bahwa jawaban satu subjek tidak berpengaruh terhadap jawaban subjek lain atau satu subjek hanya satu kali digunakan dalam analisis.

c. Pengujian Chi Kuadrat hanya dapat digunakan pada data deskrit (data frekuensi atau data kategori) atau data kontinu yang telah dikelompokan menjadi kategori.

d. Jumlah frekuensi yang diharapkan harus sama dengan jumlah frekuensi yang diamati.

e. Pada derajat kebebasan sama dengan 1, tidak boleh ada nilai ekspektasi yang sangat kecil. Secara umum, bila nilai yang diharapkan terletak dalam satu sel terlalu kecil (< 5) sebaiknya Chi Kuadrat tidak digunakan karena dapat menimbulkan taksiran yang berlebih (over estimate) sehingga banyak hipotesis yang ditolak kecuali dengan koreksi dari Yates. Bila tidak cukup besar, maka adanya satu nilai ekspektasi yang lebih kecil dari 5 tidak akan banyak mempengaruhi hasil yang diinginkan. Pada pengujian Chi Kuadrat dengan banyak ketegori, bila terdapat lebih dari satu nilai ekspektasi kurang dari 5 maka, nilai-nilai ekspektasi tersebut dapat digabungkan dengan konsekuensi jumlah kategori akan berkurang dan informasi yang diperoleh juga berkurang.

3. Contoh Soal

Berikut ini dikemukakan Chi Kuadrat untuk menguji hipotesis deskriptif (satu sampel) yang terdiri atas dua kategori dan empat kategori atau kelas.

Contoh 1 untuk dua kategori:

Telah dilakukan pengumpulan data untuk mengetahui bagaimana kemungkinan rakyat dikabupaten pringgodani dalam memilih dua calon kepala desa. Calon yang satu adalah wanita dan calon yang kedua adalah pria. Sampel sebagai sumber data diambil secara random sebanyak 300 orang. Dari sampel tersebut ternyata 200 orang memilih pria dan 100 orang memilih wanita.

Hipotesis yang diajukan adalah:

Ho: peluang calon pria dan wanita adalah sama untuk dapat dipilih menjadi kepala desa.

Ha: peluang calon pria dan wanita adalah tidak sama untuk dapat di pilih menjadi kepala desa.

Untuk dapat membuktikan hipotesis dengan rumus 5.4 tersebut, maka data yang terkumpul perlu disusun ke dalam tabel seperti tabel 5.3 berikut:

TABEL 5.3

KECENDRUNGAN RAKYAT DI KABUPATEN

PRINGGODANI DALAM MEMILIH KEPALA DESA

Alternatif Calon Kepala Desa	Frekuensi yang diperoleh	Frekuensi yang diharapkan
Calon Pria Calon Wanita	200 100	150 150
Jumlah	300	300

Catatan: Jumlah frekuensi yang diharapkan adalah sama yaitu 50% : 50% dari seluruh sampel.

Untuk dapat menghitung besarnya Chi Kuadrat (χ²) dengan menggunakan rumus 5.4, maka diperlukan tabel penolong seperti yang ditunjukkan pada tabel 5.4 berikut.

TABEL 5.4

TABEL PENOLONG UNTUK MENGHITUNG CHI KUADRAT

DARI 300 ORANG SAMPEL

Alternatif Pilihan	f_o	f_h	f_o - f_h	(f_o – f_h)²	(f_o – f_h)²/ f_h
Pria Wanita	200 100	150 150	50 -50	2500 2500	16,67 16,67
Jumlah	300	300	0	5000	33,33

Catatan: Disini frekuensi yang diharapkan (f_h) untuk kelompok yang memilih pria dan wanita = 50%. Jadi, 50% x 300 = 150

Harga Chi Kuadrat dari perhitungan dengan rumus 5.4 ditunjukkan pada tabel di atas yakni jalur paling kanan yang besarnya 33,33.

Untuk dapat membuat keputusan tentang hipotesis yang diajukan diterima atau di tolak, maka harga chi kuadrat tersebut perlu dibandingkan dengan Chi Kuadrat tabel dengan dk dan taraf kesalahan tertentu. Dalam hal ini berlaku ketentuan bila Chi Kuadrat hitung lebih kecil dari tabel, maka Ho diterima, dan apabila lebih besar atau sama dengan (≥) harga tabel maka Ho ditolak.

Derajat kebebasan untuk Chi Kuadrat tidak tergantung pada jumlah individu dalam sampel. Derajat kebebasan akan tergantung pada kebebasan dalam mengisi kolom-kolom pada frekuensi yang yang diharapkan (f_h) setelah disusun kedalam tabel berikut ini.

Kategori

I	A	M
II	B	N
	(a + b)	(m + n)

Dalam hal ini frekuensi yang diobservasi (f_o) harus sama dengan frekuensi yang diharapkan (f_h). Jadi (a + b) = (m + n) dengan demikian kita mempunyai kebebasan untuk menetapkan frekuensi yang diharapkan (f_h) = (m + n). Jadi kebebasan yang dimiliki tinggal satu yaitu kebebasan dalam menetapkan m atau n. Jadi untuk model ini derajat kebebasannya (dk) = 1.

Berdasarkan dk = 1 dan taraf kesalahan yang kita tetapkan 5% maka harga Chi Kuadrat tabel = 3,841. Ternyata harga Chi Kuadrat hitung lebih besar dari tabel (33,33 > 3,841). Sesuai ketentuan kalau harga Chi Kuadrat hitung lebih besar dari tabel, maka Ho ditolak dan Ha diterima. Jadi, kesimpulannya, hipotesis nol yang diajukan bahwa peluang pria dan wanita sama untuk dipilih menjadi kepala desa di kabupaten itu ditolak. Hasil penelitian menunjukkan bahwa masyarakat di kabupaten itu cenderung memilih pria menjadi Kepala Desa.

Contoh 2 untuk empat kategori

Telah dilakukan penelitian untuk mengetahui bagaimana kemungkinan beberapa warna mobil dipilih oleh masyarakat Madura. Berdasarkan pengamatan selama 1 minggu terhadap mobil-mobil pribadi ditemukan 1000 berwarna biru, 900 berwarna merah, 600 berwarna putih, dan 500 berwarna yang lain.

Ho : Peluang masyarakat Madura untuk memilih empat warna mobil adalah sama.

Ha : Peluang masyarakat Madura untuk memilih empat warna mobil tidak sama.

Untuk menguji hipotesis tersebut di atas, maka data hasil pengamatan perlu disusun ke dalam tabel penolong, seperti ditunjukkan pada Tabel 5.5 berikut. Karena dalam penelitian ini terdiri dari empat kategori, maka derajat kebebasannya adalah (dk) = 4 -1 = 3.

TABEL 5.5

FREKUENSI YANG DIPEROLEH DAN DIHARAPKAN

DARI 300 WARNA MOBIL YANG DIPILIH

OLEH MASYARAKAT MADURA

Warna Mobil	f_o	f_h	f_o - f_h	(f_o – f_h)²	(f_o – f_h)²/ f_h
Biru Merah Putih Warna lain	1.000 900 600 500	750 750 750 750	250 150 -150 -250	62.500 22.500 22.500 62.500	83,33 30,00 30,00 83,33
Jumlah	3000	3000	0	170.000	226,67

Catatan: Frekuensi yang diharapkan (f_h) untuk setiap kategori adalah 3000 : 4 = 750

Berdasarkan dk = 3 dan kesalahan 5%, maka diperoleh harga Chi Kuadrat Tabel = 7,815. Ternyata harga Chi Kuadrat hitung lebih besar dari harga Chi Kuadrat Tabel (226,67 > 7,815). Karena (χ²) hitung > dari (χ²) tabel, maka Ho ditolak dan Ha diterima. Ini berarti peluang masyarakat Madura untuk memilih empat empat warna mobil berbeda atau tidak sama. Berdasarkan data sampel ternyata warna mobil biru yang mendapat peluang tertinggi untuk dipilih masyarakat Madura. Ini juga berarti mobil warna biru yang paling laku di masyarakat itu.