Arfika Nurhudatiana - Senior Lecturer in Information Systems At BINUS

Data Scientist, profesi yang sedang berkembang, bagaimana melakukannya?

Avatar photo

Di era revolusi industri 4.0 kita lihat bagaimana sains dan teknologi begitu maju. Dengan kemajuan yang sangat pesat kita bakal tertinggal jika tidak memahami dasar yang kuat tentang hal itu.

Sains dan teknologi adalah ilmu yang didasarkan atas filsafat dan matematika serta penguasaan informasi.

Ada satu profesi yang sedang diminati, yaitu ”data scientist”, profesi dengan fokus pada teknologi informasi. baca juga artikel Menjadi Seorang Data Scientist? Why Not?

Dasarnya seorang data scientist bekerja mengumpulkan, mengolah dan menganalisa data untuk menghasilkan informasi penting yang berdampak pada pengambilan keputusan suatu badan usaha.

Seperti yang kita ketahui seberapa banyak perusahaan sampai startup yang bergerak di bidang telekomunikasi dan marketing yang menggunakan jasa data scientist.

Bisa dikatakan peluang untuk bekerja sangat besar, bahkan menjadi buruan perusahaan – perusahaan.

Hal ini menarik perhatian tim kami untuk mengetahui bagaimana pandangan dari seorang scientist terkait pekerjaan data scientist.

Oleh karena itu, tim kami menghubungi Arfika Nurhudatiana untuk melakukan wawancara eksklusif terkait data scientist.

Berikut hasil wawancara kami dengan mbak Arfika Nurhudatiana.

Tentang pekerjaan dan keseharian nya mbak ?

Nama, Arfika Nurhudatiana seperti di Linkedin , pekerjaan saya sebenarnya itu scientist tapi sekarang saya sedang mengerjakan project untuk online learning mata kuliah IT dan kursus data Science.

Saya juga mengerjakan data sientist tapi lebih ke consulting sifatnya tapi menggunakan teknologi microsoft.

Bagaimana peluang menjadi data scientist untuk sekarang dan kedepannya menurut mbak?

Kalau peluang untuk sekarang lagi terbuka lebar, kalau untuk ilustrasi secara period waktu saja ya, jadi waktu saya merintis, untuk men set job data scientist itu hanya satu halaman hasil pencariannya.

Tetapi, sejak beberapa bulan yang lalu, akhir 2018 sudah bisa lima halaman. Jadi, demand nya sedang growing-growingnya.

Kalau dulu data scientist itu lebih seperti data analis dan lebih nature. Jadi untuk mengambil data ekstraksi data untuk mengambil keputusan.

Tapi kalau sudah mulai mengikuti seperti di negara maju, data scientist sudah mulai bikin machine programming, bahkan ada yang pakai deep learning untuk macam-macam gitu.

Untuk tantangannya sendiri bagaimana ?

Kalau untuk data scientist karena rata-rata orangnya dari background teknis, jadi biasanya dari mathematic atau lulusan IT.

Jadi, kita mindset nya apa yang harus kerjakan ya kerjakan, tapi kita belum paham beatpeaker nya seperti apa.

Jadi tantangan sebenarnya lebih di proses, jadi nanti itu mau buat apa? Jadi pemahaman tentang bisnis nya, tentang arah, misalnya nanti outputnya automission, nah automission nanti impact nya seberapa besar, mengurangi manual leaber nya berapa persen, itu yang kurang paham.

Jadi, kita tidak bisa memprioritaskan mana saja yang harus dikerjakan terlebih dulu.

Dan yang kedua kadang-kadang kita terobsesi dengan akurasi, jadi waktu diproses itu datanya keluar 90% persen, kadang-kadang user tidak butuh yang 90%, kadang-kadang user itu hanya butuh yang 75% saja sudah cukup, karena pada akhirnya mereka akan validasi lagi.

Misalnya seperti sekarang analisis resiko default, kadang orang tidak bayar, kabur, nah kasus seperti ini kadang-kadang buat kita terobsesi nah ini 75%, kita naikin lagi menjadi 77%, jadi tidak habis-habis modelingnya.

Padahal yang dibutuhkan sekarang, yaudah kita stop dulu tapi nanti akan kita labelkan lagi yang bakal di vote sudah kita grouping yang bakal nanti kasih waktu sudah bayar akan kita grouping dan yang ditengah-tengah ada intervensi autosimiotic, jadi ada orangnya lagi yang menverifikasi telpon.

Jadi, kalau kita lihat dari kontrak bisnisnya kita tidak perlu berlebihan sampai-sampai harus mengejar akurasi, karena nanti dari usernya pun akan ada involvement manual. Jadi lebih ke penentuan mana yang lebih penting, lebih ke akurasi.

Dalam mengerjakan data scient bahasa pemograman apa yang dipakai?

Pastinya pakai phyton, cart, cart form google pasti pakai tensorflow, kadang-kadang pakai karvet yang facebook.

Jadi sekarang seperti ada dua mashup, mashup nya phyton pakai teknologinya google, jadi pakai tensorflow dari google dan kawan-kawannya, nanti yang pakai cart nempelnya ke microsoft.

Tools apa saja yang dipakai oleh data scientist?

Kalau untuk language nya pakai phyton, art, tensorflow, kalau dia mengambil visualisasi ada tablow, dan ada beberapa bisnis package. Kalau mau secara instastruktur google nya, pakai google cloud, itu disitu yang ada mesin learningnya.

Kalau pakai microsoft, other machine learning dan ada data victory. Tapi kalau microsoft lebih mahal. AWS juga ada.

Kalau mbak sendiri pakainya apa?

Kalau saya sering pakai yang microsoft atau google punya

Kenapa pakai microsoft atau google?

Karena, waktu saya mengerjakan project perusahaannya itu sudah lumayan besar dan mereka menggunakan SQL Server, jadi semua teknologi analisis nya sudah connect kesitu.

Kalau untuk perusahaan startup biasanya ada tiga pilihan, bisa AWS atau google talk. Biasanya pilih yang lebih murah, dan yang lebih murah itu adalah google talk dan kalau yang pakai google talk dia itu pakai phyton.

Tempat Kursus Komputer Terbaik | Digital Marketing, Programming, SEO, Dll.

Bagaimana sih rutinitas hariannya data scientist?

Balik ke levelnya di company, kalau dia early data scientist dia pakai hands on model, phytonnya pakai jupiter notebook terus kerjasama lagi dengan developer lain misalnya desktop untuk modelnya dicoba.

Ketika dia sudah lebih senior, dia akan mulai di project managementnya, lebih sering rapat, nentuin timeline, budget dan menentukan alokasi orang.

Kalau lebih senior lagi, dia akan memimpin project, lebih interaksi ke product owner. Karena terkadang product owner pasti akan bertanya tentang kedepannya mau bagaimana lagi? Jadi lebih ke diskusi dengan owner product data science nya.

Pekerja data science ini lebih kerja remote atau kantoran?

Kalau e-commerce itu dikantor, karena harus kerjasama dengan tim. Tetapi, kalau di consulting sering remote.

Karena clientnya “mobile”. Tetapi karena perusahaan IT itu naturenya di kantor, paling ada remote sekali dua kali dalam sebulan. Consulting yang lebih banyak remote.

Problem yang sering muncul dalam mengerjakan data scient?

Masalahnya adalah molor waktu, terkadang kita sering underestimate waktu. Terkadang kita mengira kompleksitas datanya itu medium tetapi ternyata datanya masih kotor.

Paling banyak seberanya di fase-fase awal. Misalnya kita mengambil datanya dari streaming, atau ambil dari SQL Server, atau database manapun, tetapi ternyata ada user yang tidak terintegrasi, ada data yang dari excel atau txt, jadi itu harus dirapikan lagi.

Lebih seperti data victory, harus di rapiin, masuknya harus diseragamin baru bisa dimasukin. Lebih kearah underestimate tentang datanya.

Industry apa saja yang berpeluang untuk dimasuki oleh data scientist?

Data scientist itu lebih ke intelijen, jadi kalau kita mau memasukkan intelijen kedalam suatu organisasi, pasti harus perusahaan IT, perusahaan finance ataupun perusahaan besar.

Jadi data scientist akan berkembang kalau kita masuk ke perusahaan IT, seperti google, facebook.

Dan perusahaan finance, karena perusahaan finance biasanya lebih nature, jadi dia perlu data scientist untuk decision making, seperti visa, data kreditnya perhari, atau perjam itu berapa juta.

Ketiga seperti FCCG (Fast Counsing Costumer Good), jadi mereka perlu supply nya berapa banyak, supplynya kompleks, jadi kalau perusahaan besar seperti itu data scientist nya lebih maju, karena mereka punya infrastruktur yang cukup untuk kesitu.

Kalau perusahaan yang masih menengah, yang IT nya masih standart mungkin belum mendukung kesana. Karena untuk investment science atau big data kan lumayan besar.

Rata-rata gaji seorang scients itu berapa?

Balik ke level, kalau fresh graduate, seperti consultant IT 5-8 juta, 2-3 tahun kerja bisa diatas delapan juta atau 15 jutaan itu.

Dan yang sudah 15 jutaan itu biasanya sudah handle meeting, mengatur timeline. Kalau yang expert, misalnya MHID.

Seperti pengalaman saya dia itu sangat paham dengan produk, tentu rangenya akan beda lagi. Tapi kalau expert di Indonesia yang penting dia bisa nanganin project dia tahu problemnya dimana, misalnya seperti dosen ITB atau yang lain.

Kalau mau jadi data scientist wajib tidak kuliahnya harus di IT?

Kalau mau jadi data analys tidak wajib, tapi kalau data scientist wajib, karena mau tidak mau harus mengerti matematika dan programming.

Tetapi begini, kalau orang itu backgroundnya bukan IT, dia bisa memulai dengan data analys setelah dua sampai tiga tahun dia jadi data analys dia bisa jadi data scientist karena dia sudah familiar.

Tetapi kalau ingin jadi data scientist dia harus bisa mathematic dan programming biar dia tidak kaget.

Pernah tidak punya pengalaman mengerjakan data yang sangat susah dan tidak menemukan solusi?

Pernah, tetapi itu lebih ke resource. Saya pernah punya pengalaman mengerjakan project tentang demand di market, terus orang yang mengerjakannya adalah orang yang punya background di statistic jadi terbiasa menggunakan modelling mathematic yang macam-macam.

Misalnya independent antar variabel, jadi ada beberapa rules dalam konsep statistik yang mereka harus penuhi.

Begitu mereka ingin lebih nature dengan tidak menggunakan SPSS biasa, biasanya disitu agak sedikit terkejut.

Karena di data scientist itu ada black box nya. Jadi kalau biasa pakai neuro network, biasanya orang tahu, kalau mau memasukkan inputnya itu ada modelling terus outputnya ada begitu.

Ada beberapa user tidak comfortable dengan function-function yang seperti itu.

Oleh karena itu kita harus kompromi, kalau mau akurasi kita harus memakai machine learning, karena user ingin tahu step by stepnya supaya tidak terlihat black box jadi kita harus memakai yang lebih simple, jadi decisionnya antara memakai learning atau deep tree itu agak sedikit berbeda.

Jadi kita kompromi, kalau tidak mau pakai black box berarti kita harus memakai yang lain, tetapi mungkin akurasi tidak sebaik deep learning.

Saya sebagai manager sudah sangat berpengalaman menghadapi user yang tidak sinkron, kita sebagai perusahaan ingin nature, ingin maju, jadi tidak hanya sebatas mengerjakan project tetapi juga mengedukasi user.

Ada saran untuk para data scientist ketika stuck dengan data?

Sebenarnya ada banyak bantuan, kalau saya googling saja biasanya sudah ketemu jawabannya. Jadi kalau stag itu yang pertama, kita browsing, cari di youtube dan sebagainya, biasanya juga tanya-tanya ke komunitas.

Di indonesia juga ada komunitas data scient, karena mereka kebanyakan kesehariannya kan mengerjakan data scientist.

Jadi mereka bisa kasih advice. Dan bisa juga dengan ikut online learning seperti, data cam, uni city, uni link itu sudah banyak, setiap tahun ada cost baru yang masuk.

Ambil yang gratisan buat melihat topik-topik yang baru agar tetap update.

Ada tidak bidang yang dirasa masih kurang oleh mbak sendiri?

Masih, masih begitu banyak. Karena dia berkembang begitu cepat dan komunitasnya juga berkembang begitu pesat  jadi suka merasa kurang.

Misalnya deep learning yang lagi hot saat ini, misalnya saya pakai CNN ya, orang lain sudah bahas deep learning yang untuk art, terus ada deep learning untuk aplikasi lain yang ada shorterm memory.

Kendala seperti itu yang buat saya sadar bahwa saya tidak bisa mempelajari semuanya sendiri, saya harus ikut group WA dan group Telegram supaya bisa mendapatkan contekan update setiap hari. Tetapi kalau untuk yang didalami, yang lagi ngetrend sekarang itu machine learning.

Andai bisa balik ke masa kuliah, keahlian apa yang di data scient, yang ingin lebih dikuasai?

Mungkin lebih ke social media, NLP (Natural Language Processing) karena itu sangat nature dan pusatnya big data itu kan social media, mungkin seperti text maining.

Mungkin kalau dari awal saya belajar dan ambilnya itu mungkin saya lebih bagus dan hebat.

Tetapi tidak juga demikian, karena image itu ada expertnya sendiri, text expertnya sendiri, nanti yang forecasting untuk prediksi demand di feature nanti ada method lagi. Pada intinya terus belajar, karena pada akhirnya semuanya akan diperlukan.

Pelajaran apa yang diharapkan ada dikampus, untuk membantu para data scientist?

Kerjaan data scient itu mulai dari mengumpulkan, memproses. Kalau teknik pengumpulan data itu sudah diajarkan, jadi mungkin lebih kearah proses data, proses cleaning data, kemudian modelling, statical analisisnya sampai akhirnya visualitation.

Kemudain tools dikampus dan didunia kerja itu yang berbeda, misalnya, dikampus memakai phyton, tapi phyton itu dipakai untuk programming dasar, bukan untuk data scientist.

Atau misal pakai sosialisasi software, ada BI, ada tablue, dan sebagainya. Itu semua belum tentu dikenalin dikampus, karena dikampus pakainya textbook. Jadi lebih ke tools yang perlu lebih didekatkan ke industri.

Jika harus memilih rekan kerja atau tim, bisa disebutkan tidak tiga keahlian yang diharpakan yang dikuasai oleh partner ini?

Pertama, programming, minimal phyton atau art. Pengalaman saya, ketika punya anggota yang jago programming itu bahagia karena apapun yang diminta langsung segera diselesaikan.

Kedua, hardskill pengalaman untuk melihat kelemahan dan kelebihan data. Dan yang ketiga kolaborasi, perlu orang yang fleksible dan open minded.

Lebih suka kerja malam atau siang?

Karena sudah lebih berumur, jadi lebih suka kerjanya siang.

Mbak Arfika punya tidak sisi lain selain sebagai programmer, misalnya hobby traveling atau yang lainnya?

Saya suka memerhatikan pop culture, saya suka memerhatikan people culture, saya suka buka people.com dan lihat infotainment, trend fashion, karena kalau mikir kan capek, dan teman-teman sering bilang saya update, terutama tentang drama Korea.

About the author

Avatar photo

Arfika Nurhudatiana

Data Scientist, Senior Lecturer in Information Systems BINUS

Add Comment

Leave a Comment

Click to ask
Hai, Tanya-Tanya Aja
Hi ini Windy, dari techfor

Windy bisa membantu kamu memahami layanan Techfor
Seperti

1. Kursus Online By Expert
2. Partnership Event dan Konten
3. Layanan liputan multimedia
4. Dan hal lain yg ingin kamu tau

Kirim saja pesan ini serta berikan salah satu nomor diatas atau beritahukan windy lebih jelas agar dapat membantu Kamu