Ternyata Ternak Ayam Juga Butuh Data Science

1

Ada yang mengatakan bahwa Data Science adalah bagian dari Matematika, bagian dari Computer Science. Atau bahkan gabungan dari keduanya? Kenapa ramai sekali diperbincangkan saat ini?

Baca Artikel Terkait : Bagaimana Peran Data Scientist Pada Dunia Perbankan ?

Istilah data science sendiri baru muncul beberapa waktu terakhir, dan mengejutkan publik dengan betapa berpengaruhnya bidang ini dalam bidang bisnis.

Semenjak kehadiran Data Scientist, para programmer sangat terbantu dalam banyak hal. Bahkan di beberapa kasus, programmer tidak bisa membuat sebuah project tanpa seorang Data Scientist.

Kebutuhan akan profesi sebagai seorang Data Scientist telah meningkat pesat di Amerika Serikat.

Bahkan di Indonesia sendiri profesi ini mulai banyak dibutuhkan oleh perusahaan – perusahaan untuk menunjang produktifitas mereka.

Tidak hanya industri teknologi saja yang membutuhkan jasa seorang Data Scientist, bahkan perusahaan manapun membutuhkan jasa mereka untuk memprediksi hasil produksi perusahaan selama waktu tertentu.

Sebenarnya apa itu Data Science? Tentu banyak sekali pendapat dari para ahli tentang bidang yang satu ini. Pada kesempatan ini Techfor ID bertemu dengan Manggala Ratulangie, CEO dari Datanest untuk menanyakan hal-hal seputar Data Science.

Berikut hasil wawancara kami dengan Manggala.


data science indonesia, perbedaan data science big data dan data analytics

Kita lihat sebagai CEO dari Datanest, Pak Manggala spesifik keahliannya memang di data?

Iya, sebenarnya dulu tidak dibilang data science karena orang data dulu biasanya di ERP, Data Warehousing, which is labelnya dulu masih jadi ERP Engineer.

Boleh diceritakan bagaimana pekerjaan Bapak waktu dulu?

Awal mulanya saya tertarik soal data dari zaman kuliah, kemudian saya tertarik dengan ilmu yang zaman dulu disebut ERP, belum ada Big Data.

Ilmu ERP (Enterprise Resource Planning) didalamnya me-maintain infrastruktur keseluruhan data dari perusahaan atau enterprise dan merupakan core IT system.

Skripsi saya juga tentang ERP, sampai akhirnya saya bekerja di beberapa perusahaan dan meng-engineered data dalam jumlah besar.

Berikutnya saya mengambil sertifikasi untuk SAP. Setelah membantu peng-implementasian sistem SAP beberapa kali, saya mendapatkan pengalaman bagaimana cara mengelola data lebih efektif dan efisien. Namun karena ilmu dari data warehouse sebenarnya sudah mature, perubahannya tidak terlalu banyak dan besar.

Kecenderungan perusahaan kala itu ketika menerapkan suatu ERP, sekali menerapkan diharapkan sistemnya sustain seumur hidup. Padahal hal seperti itu tidak mungkin bila kita berbicara masalah IT.

Bagaimana peluang seorang data scientist sekarang dan kedepannya menurut bapak?

Sejauh ini sangat potensial, karena jangankan di Indonesia di seluruh dunia juga kekurangan data scientist.

Data scientist yang saya maksud disini adalah yang benar-benar orang menguasai antara ilmu statistik matematik, programming dan bisnis proses.

Kebanyakan orang hanya ambil kursus atau training soal data science. Kemudian sudah menyebut dirinya sebagai data scientist. Itu buat saya kurang tepat, sama seperti orang baru mengambil kursus bahasa pemrograman kemudian dikatakan sebagai programmer. Ya, bisa saja namun mereka belum punya real business case nya.

Apa tantangan yang dihadapi secara bisnis untuk data scientist?

Secara bisnis awareness perusahaan soal data di Indonesia, masih belum major seperti di negara-negara lain.

Untuk pengolahan ataupun treatment terhadap sebuah data masih belum dirasa terlalu penting untuk banyak perusahaan.

Tetapi beberapa perusahaan sekarang mulai menyadari bahwa mereka harus melakukan analisa yang lebih mendalam dibandingkan dengan yang mereka lakukan saat ini.

Challenge-nya adalah bagaimana merubah mindset perusahaan yang tadinya berkutat didalam hal yang kita sebut descriptive analytics, lebih ke diagnostic, lebih ke advanced analytics.

Karena kalau descriptive analytics itu biasanya hanya menimbulkan reaction, reaction itu “wah sepertinya penjualan turun kita mesti kasih promo” bukan jadi preventive. Kalau kita bisa memperkirakan bahwa penjualan akan turun berarti bagusnya kita sudah siap-siap di depan.Ibarat kalau kita melihat langit sudah mendung berarti kita sudah siap-siap bawa payung. Kalau terjadi hujan kita sudah prepare, kalau tidak hujan tidak masalah. Hal seperti itu yang masih kurang untuk diterapkan di perusahaan-perusahaan mayoritas di Indonesia.

Data Science sendiri menggunakan bahasa pemrograman enggak sih? Kalau iya, biasanya bahasa pemrograman apa yang dipakai?

Sebenarnya kalau bicara soal bahasa pemrograman relatif, hanya saja untuk saat ini yang paling berkembang di data science masih Python. Karena masih banyak library-library analytics yang di-develop dengan Python.

Library-library analytics yang open sources tentunya, kalau bicara yang close sources ada banyak seperti SPSS, Matlab dan lainnya. Namun biasanya, mereka menggunakannya hanya sampai level research bukan level implementasi. Kalau sampai implementasi biasanya kalau dari data science itu Python, namun ada beberapa yang berangkatnya dari R programming. Kalau bicara keseluruhan sebenarnya ada banyak, tentunya bahasa yang paling mendekati ke mesin itu paling bagus untuk pengolahan data, contohnya kalau kita main di voice recognition itu biasanya jauh lebih cepat kalau kita bisa porting algoritmanya ke C++.

Tools apa saja yang membantu data science? Atau ada software khusus yang biasa digunakan?

Kalau tools biasanya Jupyter Notebook masih memegang tempat untuk programming data karena banyak digunakan untuk modeling data science di perusahaan-perusahaan. Sekarang banyak juga toolsyang sudah beredar, dengan model drag and drop yang cukup fitur engineering saja, kemudian deploy. Tools seperti datarobot, dataiku, dan lainnya, mereka sudah mulai memiliki paradigma bahwa data science tidak perlu lagi coding.

Tetapi kembali lagi, jika kebutuhan kostumisasi dari sebuah model biasanya cukup tinggi sehingga ujung-ujungnya kembali lagi ke code, kembali lagi ke coding.

Bagaimana gambaran pekerjaan seorang  data science sendiri?

Data science, mostly lebih banyak membahas soal bisnis strategi, data cleansing, preprocessing kemudian modelling.

Mayoritas. Tapi ada beberapa case yang fully modelling. Tergantung case hanya mayoritas 70-80% pekerjaan data science itu pasti membahas soal business strategy, data cleansing, data preprocessing, baru kemudian masuk ke modelling.

Kalau masalah waktu pengerjaan tergantung dari tingkat kesulitannya. Namun step-by-step nya sepertinya itu. Bisa saja seharian melakukan cleansing data.

Problem yang sering muncul saat melakukan data science yang muncul setiap saat?

Macam-macam, terkadang dari klien ada yang datanya kurang atau datanya yang tidak konsisten atau biasanya penjelasan mengenai data mereka ambigu. Namun bila masalah itu sudah teratasi, biasanya sudah clear.

Saat ini kan di kalangan millenials senang yang namanya kerja dirumah atau remote. Kalau sebagai data scientist sendiri memungkinkan hal itu tidak?

Kalau saat ini di kita, semua datang ke kantor, karena mayoritas data klien-klien kita private jadi hanya bisa diakses dari kantor. Walaupun beberapa case kita memperbolehkan untuk remote namun dengan connect ke VPN kantor. Bukan masalah kurang bagus, tapi ada plus dan minus-nya.

Kalau kita hanya butuh untuk creating model saja mungkin bisa remote kalau untuk diskusi tentang business process pastinya lebih efektif jika bertemu langsung. Sebenarnya culture di Indonesia belum memadai untuk fully-remote untuk mengerjakan sesuatu.

Kalau seandainya kembali ke masa kuliah atau training, keahlian apa di bidang machine learning atau data science yang diharapkan lebih dikuasai?

Statistika, matematika, dan logika pemrograman. Karena seorang data scientist itu harus punya knowledge mendalam masalah matematik dan statistik dalam menerapkan rumus-rumus tersebut ke business case. Logika pemrograman karena hasil analisa bentuknya jadi algoritma dan harus bisa menerjemahkan algoritma tersebut dalam bentuk code.

Kalau tahu cara yang baik dari melakukan coding akan mempermudah untuk melakukan deployment ke production. Agar data engineer tidak perlu lagi melakukan refactoring code atau diskusi mendalam lagi soal algoritmanya.

Boleh kasih gambaran 5 industri yang kini berpeluang untuk seorang data scientist?

Di Indonesia hampir semuanya, mulai dari financial institution, insurance, retail, manufacture, logistic dan lainnya. Kemudian kini ada ride sharing seperti Gojek atau Grab. Terlebih lagi medical seperti memprediksi penyakit, prediksi kebutuhan obat, behavior dari suatu penyakit.

Dan salah satu yang terkenal saat ini Google Duplex, AI (Artificial Intelligence) yang bisa melakukan pemesanan via telepon secara otomatis.

Berbicara tentang data science sebenarnya bisa masuk ke banyak industri, namun problemnya biasanya data scientist itu bisa masuk apabila data perusahaan tersebut sudah ready, sudah siap untuk diolah.

Perusahaan akan sulit memiliki data scientist apabila data yang mereka punya belum mature, belum terstruktur dengan baik dan belum punya goals khusus untuk diselesaikan.

Berapa rata-rata range gaji seorang data scientist?

Starting 6 juta sampai kalau yang senior level itu diatas 20 juta.

Untuk jadi data scientist harus wajib kuliah IT, tidak?

Tidak perlu. mayoritas data scientist kita datang dari statistik matematik dan ada beberapa yang dari IT. Keunggulan dari IT atau fakultas matematik dan statistik mereka menambah ilmunya hanya sedikit daripada yang datang dari bisnis.

Misalnya ada satu orang master di bidang logistik, biasanya learning curve untuk belajar statistik, atau mathnya jauh lebih susah daripada orang programmer untuk belajar ke bisnis. Tetapi tidak ada aturan khusus seorang data scientist harus datang dari IT atau dari matematik karena ada juga yang datang dari elektro. Biasanya yang masih mendekati, yang di kuliahnya masih ada programmingnya.

Bagaimana pengalaman mengolah data tersulit hingga akhirnya bisa menemukan solusi? Dan apa penyebabnya?

Beberapa kali, ketika mesti combined dari data. Kita ada perusahaan yang minta kita memprediksi.

Misal perusahaan tersebut merupakan perusahaan frozen food yang membuat product chicken nugget, dia minta prediksi ketika 1 telor menetas maka 30 hari kedepan berat ayamnya berapa.

Itu case yang cukup unik karena datanya besar tidak hanya tekstual ada juga gambar ada juga temperatur suhu kemudian data vaksin obat-obat untuk anak ayam, dan ini kita predict sampai 30 hari kedepan.

Kenapa sampai 30 hari kedepan? Karena ketika 31 hari ayam layak potong. Jadi mereka mau predict berapa produktivitas mereka harus mereka produksi sampai bulan depan.

Dapat solusinya pak?

Alhamdulillah dapat. Karena data set mereka sangat lengkap dan detail.

Kenapa kasus tersebut disebut susah?

Karena ayam seperti makhluk hidup lain yang terpengaruhi genetik, kemudian behaviors ayam yang ada di ternak berbeda dengan ayam lepas. Ayam peternakan punya perusahaan pasti beda dengan ayam peternakan umum.

Treatment-nya beda, cara processing datanya, cara mereka melakukan maintenance-nya beda, perawatan juga beda, itu challenge-nya.

Bahwa terkadang untuk mem-predict satu hal tidak bisa satu model prediksi langsung bisa untuk semua. Untuk beberapa case bisa jadi dua atau tiga model untuk menyelesaikan satu masalah.

Bagaimana saran untuk para data scientist yang mentok ketika meriset data?

Saran saya, di internet ada semuanya, jangan pernah berpikiran problem-nya hanya kita saja yang pernah menghadapi, tanya ke komunitas, dan pastikan pertanyaannya itu berkualitas jangan terlalu generic.

Dan sisanya banyak baca literatur-literatur karena sekarang banyak open literatur tentang perkembangan algoritma, cara pengkodean dan library yang perkembangannya cukup pesat, setiap hari ada saja update baru.

Walaupun tidak diimplemen pada saat itu, tidak ada salahnya membaca atau mempelajari struktur dari library atau literatur-literatur tersebut. Siapa tau one day you need it for solving your problem

Komunitas apa saja yang bisa membantu data scientist?

Sekarang di Indonesia yang paling ramai itu DSI, Data Scientist Indonesia, ada Machine Learning Indonesia. Kalau di luar negeri coba main-main ke Kagel dan itu banyak case yang bisa dipakai. Untuk case-case nya, mereka kasih real case, kemudian banyak orang-orang yang bisa diajak diskusi.

Pelajaran apa yang diharapkan bapak agar kampus dapat membantu mahasiswa menjadi profesi data science?

Real business case. Kebanyakan kampus hanya mendapatkan trial business case atau business case yang bukan di Indonesia.

Karena kebutuhan analisa data antara orang indonesia dengan orang malaysia sudah pasti berbeda. It’s good jika kita bisa implemen dan solving problem untuk data set dari luar tapi it’s not that good karena mungkin tidak bisa di implementasi di negara sendiri.

Jadi bagusnya kampus-kampus ada kerjasama dengan perusahaan yang punya data besar seperti distributor atau manufaktur yang case-case nya dibawa ke kampus.

Jadi knowledge dan pengalaman seorang ketika lulus bisa langsung terserap ke industri-industri di Indonesia untuk melakukan kajian analytics.

Keahlian apa yang masih kurang dan masih harus dikuasai data scientist?

Keahlian yang masih kurang itu riset, namanya juga data scientist tidak lepas dari riset, walaupun title di perusahaan as a data scientist tapi mayoritas dari mereka kerjanya hanya report builder, hanya membuat report.

Kekurangan dari kita adalah riset tentang menerapkan satu algoritma atau menerapkan satu solusi dengan data science di Indonesia. Jadi case seperti itu yang memicu untuk melahirkan data scientist yang memiliki critical thinking yang bagus.

Jika bisa memilih, keahlian apa yang diharapkan dimiliki partner kerja bapak dibidang bisnis dan data scientist?

Kalau bisnis sudah pasti kalau bicara era digital sekarang biasanya menurut saya founder ideal itu satu digital company atau tech company itu harus 1 orang yang mengerti tech dan 1 orang yang mengerti bisnisnya.

Kalau dari sisi data scientist, partner kerjanya harus ada data engineer dan data ops. Kalau data science untuk creating model untuk implementasi model harus punya data engineer and data ops. Jadi itu partner yang paling ideal.

Saat ini di Indonesia masih kekurangan untuk jobdesk – jobdesk itu. Jadi sebenarnya yang mau saya tekankan kalau mau main di data tidak sepenuhnya harus jadi data scientist, karena yang dibutuhkan juga ada data engineer dan data ops/operation.

Bagaimana gaya kerja yang diharapkan?

Kolaboratif dan kritis. Jadi culture di Datanest, bahwa masing-masing divisi setiap 2 minggu sekali, akan ada presentasi dari satu orang selama 30 menit. Untuk mempresentasikan apa yang dia lakukan atau tentang apa yang dia punya dari sisi ilmunya, bagaimana cara penerapan.

Tujuannya bukan agar orang lain bisa mengerjakan apa yang dilakukannya, tetapi bagaimana orang lain paham apa yang dia lakukan sehingga terjadi sinergi. Jadi di kita konsepnya itu done itu selesai berarti 100% selesai, tidak ada 99% selesai. Kalau seorang data scientist udah create model selesai dan data engineer belum bisa men-deploy model tersebut kategorinya belum selesai.

Dengan culture seperti itu akhirnya masing-masing orang menghargai proses dan bisa saling membantu untuk menyelesaikan pekerjaan.

Lebih suka kerja malam-malam atau siang? Dan alasannya kenapa?

Kalau buat saya kerja lebih enak pagi, karena masih fresh. Kalau kita bisa pergi pagi dan kerja kita optimal berarti istirahat kita cukup. Kalau kerja malam biasanya pagi tidak terlalu semangat. Kita selalu berusaha delivery task tepat waktu jadi orang tidak perlu kerja malam. Target di Datanest adalah orang jangan sampai lembur.

Jika anda ingin bertanya kepada Manggala Ratulangie. Anda bisa bertanya pada kolom di bawah.

Share.

About Author

Manggala Ratulangie

CEO & Co-Founder at Datanest

1 Komentar

Leave A Reply