Terjebak Istilah “Data-Driven” = Terjebak Nostalgia

Dalam diskusi di rumah pagi ini, ada yang membahas tentang prediksi pemodelan pandemic yang dilakukan di negara tetangga tentang kapan berakhirnya pandemic dengan memberikan judul “data-driven”. Seolah-olah kata data-driven memberikan bobot lebih tinggi terhadap hasil pemodelan, karena berbasis data. Namun bukankah jika datanya tidak valid maka sebenarnya hasil modelnya tidak valid? Apalagi ketika negara tetangga melakukan prediksi kondisi Indonesia, lha datanya dari mana? ketika kita sendiri masih berdebat tentang data yang ditampilkan oleh pemerintah.

Jika kita lihat konteksnya, Data-driven menjadi istilah populer ketika dunia memasuki masa big data, yaitu ketika aktivitas manusia untuk pertama kalinya dapat dikumpulkan secara masif melalui interaksi dia dengan perangkat digitalnya. Setiap halaman yang anda click, video yang anda pilih, berapa lama anda berada dalam satu halaman, aplikasi apa yang anda install, anda jalan kemana saja dengan bantuan peta digital, itu menjadi sebuah timbunan data yang luar biasa besar tentang diri anda. Timbunan data ini kemudian di”masuk-akal”kan untuk melakukan prediksi tentang profil anda. Profil ini bisa saja akan mengungkapkan kejutan tentang apa sebenarnya yang anda sukai, yang bisa berbeda dari apa yang anda pikir anda sukai.

Jika diagregasi ke skala yang lebih besar, timbunan data personal ini bisa menjadi data group, group menjadi organisasi, lalu industri, hingga wilayah, nasional dan dunia. Contoh dari agregasi ini adalah Laporan tahunan google tentang apa yang sering dicari di Indonesia adalah salah satu contohnya (2019 Report). Laporan ini menarik karena seperti membuka kebiasaan orang Indonesia mungkin tidak diketahui oleh orang Indonesia sendiri. Ada mungkin sekelompok kecil orang Indonesia yang berbeda, namun ketika ini adalah big-data, maka seolah-olah menjadi pembenaran bahwa kerikil-kerikil kecil berupa ketidaksesuaian atau ketidavaliditasan data pasti kalah dan dihaluskan dengan data lain yang lebih banyak jumlahnya.

Ini mirip dengan salah satu strategi utama dalam perdebatan di sosial media yang mengandalkan bias keputusan manusia bahwa semakin banyak yang bicara bahwa suatu hal itu benar, maka hal itu “seharusnya” benar. Jadi jika ada 1 konten yang tidak sesuai atau sukai walaupun benar, harus langsung di bombardir dengan 100 hal lain supaya yang 1 tersebut tidak sempat terbaca atau orang menjadi ragu terhadap kebenaran hal tersebut. Ketika seorang pakar sesungguhnya menjadi kalah dengan barisan pakar-pakaran.

Lalu bagaimana dengan prediksi model data-driven ketika datanya tidak big? artinya data tidak banyak. Ini berarti pengujian validitas data menjadi proses yang sangat penting. Ini termasuk keterbukaan dan penjelasan asumsi sebagai pelengkap data juga penting. Lalu perlu juga pelabelan pemberian peringatan untuk kelemahan data-driven model diberikan ketika data tidak sebanyak seharusnya.

Anda sebagai pembaca juga harus kritis terhadap data yang digunakan, ketika sharing hasil penelitian yang menggunakan kalimat “data-driven”, perhatikan konteks penelitian tersebut. Para peneliti juga dengan mudah berlindung kepada bahwa data yang dia olah adalah data yang ada. Mereka bisa mengatakan bahwa kalau prediksi kami salah, ya salahkan datanya. Istilahnya GIGO: Garbage In Garbage Out. Padahal sebuah prediksi berbeda dengan proyeksi, prediksi memiliki makna interpretatif dan penambahan asumi, proyeksi hanya meneruskan kecenderungan data. Tapi yaa bagaimana lagi, Apalagi di dunia sosial media saat ini kan permintaan maaf gampang diberikan, yang penting sudah memdapatkan nilai tambah mejeng keren di awal.

Oh ya kenapa saya tuliskan terjebak nostalgia, dalam kejadian normal, cara manusia memandang masa lalu adalah disesuaikan dengan kondisi masa kini. Di generasi saya ketika perploncoan masih marak, akan memandang masa tersebut dengan penuh nostalgia, padahal ketika melalui perploncoan kita susahnya luar biasa. Memandang nostalgia bisa positif maupun negatif, walapun secara umum seuatu kenangan disebut nostalgia biasanya karena positif. Jadi yang saya maksud terjebak nostalgia adalah, data masa lalu dianggap prediktor dari masa depan, padahal belum tentu data tersebut bisa menjadi prediktor karena kualitas dan validitasnya.

Dan dalam kejadian disruptif, struktur sistem akan terganggu secara masif dan terstruktur baik. Data masa lampau menjadi prediktor buruk untuk masa depan, karena dihasilkan berdasarkan struktur lampau yang sudah berubah. Sehingga semua data-driven model harul dicermati bagaimana mereka mengatasi ini. Jangan mudah terjebak nostalgia.

2 komentar pada “Terjebak Istilah “Data-Driven” = Terjebak Nostalgia”

  1. Halo pak Hidayatno, semoga dalam keadaan sehat selalu ya pak .
    Begini pak saya ingin bertanya , saya mengambil jurusan Teknik Industri Otomotif sekarang baru memasuki tahap PKL sekaligus untuk Tugas Akhir di Perusahaan yang bergerak di bidang pembuatan Bearing, salah satu anak perusahaan astra saya di tempatkan di bagian Engineering . Saya ada kepikiran untuk memakai metode vsm . Kira kira ada solusi untuk memakai metode tersebut , apakah saya jalankan dan lihat dulu sambil menulis laporan PKL tersebut. Mungkin ada solusi dan arahan tersebut baiknya gimana. Terima kasih pak.

    1. Karena memang ada unsur pemetaan disitu maka sebaiknya yaa dipetakan dulu untuk melihat gejala permasalahannya apa, lalu dari gejala itu dicari akar permasalahannya menggunakan fishbone. Akar permasalahan diprioritaskan. Prioritas tertinggi dievaluasi kelayakannyan. kemudian dicari solusinya, dipetakan ulang dan dilihat kenaikan perbaikannyan

Tinggalkan Balasan ke Ddnny Batalkan balasan