Tuesday, November 12, 2013

Penelitian Tidak Replikatif Karena Statistik Lemah

Laporan Penelitian - Statistik ketat membuat ilmu lebih baik. Banyak studi ilmiah datang dengan kesimpulan palsu hanya karena standar signifikansi statistik terlalu rendah.

Meningkatnya jumlah studi yang tidak dapat direplikasi karena tidak memiliki hasil nyata di tempat pertama. Masalah-masalah terburuk sering dijumpai dalam ilmu-ilmu sosial dan biologi. Ada upaya di kalangan psikologi untuk menjelaskan mengapa banyak studi tidak dapat direplikasi.

"Mereka bahkan menuduh para ilmuwan ketika menambang data. Tapi masalahnya bukan itu. Titik masalah adalah ambang batas penentuan signifikansi terlalu lemah," kata Valen Johnson, statistikawan Texas A&M University di College Station.

Uji statistik yang lebih ketat diperlukan sebelum hasilnya diterima. Secara tradisional, para ilmuwan menguji hipotesis alternatif terhadap hipotesis nol sebagai status quo atau kurangnya efek. Setelah eksperimen, keputusan dibuat apakah menerima atau menolak hipotesis nol.

Hipotesis nol ditolak dan hipotesis alternatif diadopsi hanya jika kemungkinan hipotesis nol terjadi di bawah nilai ambang tertentu. Seringkali nilai P ditentukan sebesar 0,05 atau signifikansi pada tingkat 5 persen.

"Ambang batas 0,05 diputuskan secara sewenang-wenang oleh Fischer, Neyman dan Pearson pada tahun 1930-an, para ahli statistik pada jaman itu dan orang hanya menerima saja," kata Johnson.

Uji statistik klasik dengan nilai P jadi populer di kalangan ilmuwan, tapi ada juga pendekatan lain dikenal sebagai statistik Bayesian. Pendekatan Bayesian benar-benar membandingkan hipotesis nol dengan hipotesis alternatif. Faktor Bayes harus tinggi untuk mendukung hipotesis alternatif.

"Jika fisikawan membuat temuan akan direplikasi di laboratorium lain. Nilai P sebesar 0,05 terlalu lemah untuk menerima temuan baru sebagai kebenaran," kata Johnson.

"Temuan Higgs Boson adalah P = 0,0000003. Biologi biasanya menggunakan P = 0,05 sebagai batas temuan baru. Hal ini dapat memiliki dampak besar ketika uji obat," kata Johnson.

"Efek eksperimen Tahap 2 pada P = 0,05, tapi tidak muncul ketika melakukan uji coba klinis lebih besar. Banyak ongkos yang harus dibayar karena temuan palsu," kata Johnson.
Revised standards for statistical evidence

Valen E. Johnson1
  1. Department of Statistics, Texas A&M University, College Station, TX 77843-3143
Proceedings of the National Academy of Sciences, November 11, 2013

Akses : DOI:10.1073/pnas.1313476110
Tinuku
Bagikan :

No comments:

Post a Comment