Perkenalkan, saya Taufik Pratama lulusan politeknik negeri bandung. Saat ini saya adalah seorang data scientist di ruang guru yang sedang terlibat dalam pengembangan project AI (Artificial Intelligence), kami menyebutnya robo guru.
Kamu bisa dengarkan wawancara tim Techfor.id dengan Taufiq Pratama
Data Scientist at Ruang Guru dengan klik tombol play di bawah ini.
Secara sederhana robo guru ini adalah aplikasi untuk mempermudah user dalam menjawab berbagai soal mata pelajaran, terutama pelajaran matematika.
Cara kerja aplikasi ini cukup mudah, user hanya perlu mengambil foto soal, kemudian aplikasi tersebut akan memproses jawabannya.
Nah, tantangan terbesar dalam project AI ini adalah mengoptimalkan tiga variabel dasar mencakup akurasi (ketepatan jawaban), runtime (kecepatan memproses data) dan memory.
Misalnya saja, jika akurasi bagus tapi kecepatan memproses datanya membutuhkan waktu beberapa detik, kami tidak ingin user menunggu lama untuk mendapatkan jawabannya atau sebaliknya, meskipun proses datanya cepat tapi akurasi menurun,
Hal-hal seperti inilah menjadi tantangan tersendiri dalam project AI robo guru yang sedang kami kembangkan. Menarik bukan ?
Sekilas tentang proses pembuatan dan tantangan dalam Project AI robo guru, project AI ini mempunyai beberapa tahapan dalam proses pengerjaannya, karena ini berkaitan dengan pendeteksi soal maka pertama-tama team harus mendesain AI terlebih dahulu untuk mengindentifikasi kemampuan AI yang akan digunakan nantinya.
Misalnya saja untuk mengetahui jawaban dari soal, baik soal bergambar atau multiple choice, karena soalnya dalam bentuk foto, maka kami perlu mengextract fotonya terlebih dahulu kemudian setelah itu mencari riset-riset yang telah di publish untuk di jadikan sebagai data.
Team juga mencari tahu berapa lama waktu yang di butuhkan untuk memproses soal atau seberapa besar memory yang di butuhkan.
Biasanya tantangan terbesarnya adalah meningkatkan akurasi tanpa melakukan riset yang terlalu besar atau runtime yang terlalu lama juga kapasitas memory server yang bisa overload karena sent by requestnya yang telalu besar.
Oleh karena itu, team bekerja semaksimal mungkin untuk mengoptimalisasi akurasi, kecepatan dan memory.
Di ruang guru, para data scientist bekerja secara team, karena divisi kami masih relatif baru. Satu team hanya terdiri dari tiga orang yang masing–masing mempunyai keahlian khusus yang cukup di perlukan dalam mengerjakan berbagai project.
Bidang programming misalnya, bidang ini cukup vital karena banyak project yang dikerjakan berkaitan dengan informatika, terlebih lagi dalam project robo guru menggunakan bahasa pemrograman Python.
Kenapa Python ? karena Pyhton lebih mudah terintegrasi dengan sistem yang lebih besar. Selanjutnya yang expert di bidang Matematika dan orang yang bertugas mengintegrasi program dengan sistem yang lebih besar, biasa disebut dengan machine learning engineer.
Ada beberapa software yang biasa kami gunakan dalam keseharian, untuk version control sistem biasanya kami menggunakan Git Lab, karena selain pupuler digunakan, Git Lab mempunyai keungulan dari segi fitur dan tampilan.
Sedangkan untuk proses dokumentasi ruang guru menggunakan Clips yang fiturmya tidak jauh berbeda dengan yang berbayar, dan untuk komunikasi dalam perusahaan kami menggunakan Slack karena Slack selain dapat dijadikan sebagai ekosistem komunikasi perusahaan juga mempunyai fitur channel khusus yang bisa digunakan dalam berinteraksi dengan sesama anggota satu divisi atau bidang.
Sedangkan untuk hardware, kami biasa menggunakan laptop untuk experiment, misalnya di gunakan untuk load 2000 gambar sebagai kebutuhan riset dalam proses pembuatan gambar atau dalam proses training model terlebih lagi dalam jika kasusnya image reconigtion, data imagenya yang bisa dalam berbagai ukuran.
Di ruang guru sendiri, walaupun sifatnya bekerja di kantor namun setiap karyawan di beri keleluasaan dua hari dalam seminggu untuk bekerja di luar ruangan, biasanya digunakan untuk mencari suasana baru agar tidak terlalu monoton atau bisa bekerja di rumah.
Mengingat banyaknya ilmu terapan yang terkandung dalam data science, maka langkah pertama untuk menjadi seorang data scientist adalah fokus dalam satu bidang terlebih dahulu sampai kamu benar-benar menguasai dan nyaman dengan bidang tersebut, setelah itu kamu bisa melanjutkan kebidang lainnya.
Langkah kedua adalah perbanyak membaca, termasuk artikel, karya ilmiah atau paper, hal ini di sebabkan karena data science adalah bidang yang mempunyai perkembangan sangat cepat, dulu misalnya kami tidak mengenal deep leaning, tapi di era sekarang ada banyak perusahaan yang menggunakan deep leraning.
Salah satu buku yang paling saya sukai saat ini adalah Disruption karya Rhenald Kasali yang membedah teori Disruptive Innovation dari Clayton Christensen dan menerjemahkannya menjadi berbagai studi kasus yang lebih mudah dimengerti, terutama untuk para praktisi, walaupun memang dasar-dasar akademis juga turut diberikan sebagai dasar kerangka berpikir.
Contohnya yang sedang populer di Indonesia, tentang keberadaan para angkutan online yang perlahan tapi pasti mampu menggerus laba dari angkutan tradisional seperti taxi.
Pada mulanya, Incumbent seperti angkutan konvensional tentu tidak akan menyangka bahwa angkutan online mampu membuat perubahan yang sebenarnya sangat besar, tapi tidak mendadak.
Hal inilah yang seringkali membuat incumbent terlena, merasa bahwa posisinya di atas angin, hingga akhirnya data dan statistik membuktikan bahwa para startup ini ternyata berdampak cukup signifikan.
Buku ini mengembangkan pola pikir kami untuk lebih maju agar lebih bisa bersinergi mengikuti perkembangan zaman. Dan yang terakhir adalah kemampuan critical thinking yang cukup bagus.
Kemampuan ini sangat di perlukan dalam keseharian data scientist dalam menyelesaikan berbagai persoalan yang terus berkembang seiring perubahan zaman.
Misalnya saja, jika CEO atau bisnis analis menginginkan project social networking analisis. Dengan request untuk mengetahui seberapa besar influence sebuah akun di Twitter, kami perlu mendefinisikan influence yang di maksud dan mencari cara untuk mengubahnya kedalam bentuk kuantitatif, disinilah pengetahuan yang luas yang di dapat dari bacaan dan proses critical thinking bekerja. Terlebih lagi biasanya hal tersebut di luar bidang ilmu yang di pelajari.
Oh ya, data scientist sendiri adalah satu profesi yang berada dalam bidang interdisipliner dengan fokus pada teknologi informasi. Sederhananya, seorang data scientist mengumpulkan, mengolah, dan menganalisa data untuk menghasilkan informasi yang berguna dalam pengambilan keputusan suatu organisasi atau badan usaha.
Untuk menjadi seorang Data Scientist sebenarnya tidak hanya terkhusus bagi orang-orang Teknik Informatika, namun juga terbuka peluang yang cukup besar untuk bidang keilmuan lainnya, seperti fisika atau yang berkaitan dengan MIPA, walaupun saat ini didominasi oleh teknik informatika, statistik dan matematika.
Karena pada dasarnya Data Scientist sendiri adalah ilmu riset yang terdiri dari gabungan berbagai ilmu terapan seperti informatika, statistika dan bahkan saat ini sudah merambah ke bidang bisnis analisis yang digunakan dalam memprediksi kredit macet.
Tempat Kursus Komputer Terbaik | Digital Marketing, Programming, SEO, Dll.
Semua itu tergantung kebutuhan perusahaan. Di ruang guru sendiri para data scientist lebih cenderung berfokus pada data analytic. Kebutuhan dasar ilmu yang harus dikuasai untuk terjun dalam dunia data scientist berkaitan dengan ilmu statistik, aljabar linear, kalkulus atau matematik sedangkan untuk soft skillnya diperlukan pemahaman terhadap machine learning dan pemograman AI.
Untuk level profesinya, data scientist juga tidak berbeda jauh dengan software engineer yang meliputi junior, mid dan senior data scientist.
Level profesi dalam Data Scientist juga membantu untuk saling sharing dalam berbagai persoalan, misalnya jika kami mendapatkan permasalahan yang serius untuk memecahkannya, biasanya persoalan itu dikomunikasikan dengan leader kemudian leader akan mengadakan pertemuan dengan Data Scientist yang lebih senior untuk memecahkan permasalahan tersebut.
Di level perguruan tinggi, belum ada mata kuliah khusus tentang data science, semuanya masih tergolong umum tidak ada spesifikasi khusus dalam bidang ini.
Maka menurut saya perlu ada mata kuliah yang mempelajari tentang data science, mengingat peluang yang cukup besar dan perkembangan yang terus meluas di bidang data scientist, termasuk bidang edukasi bahkan biologi yang meneliti data molekul untuk di jadikan draft covering.
Prosedur pengajaran juga harus lebih banyak menitik beratkan kepada metode praktik, jadi tidak selalu dalam ruang lingkup teori. Para pelajar dapat ditantang dengan membuat sebuah produk dengan basis data real dalam bentuk scoring atau image classification yang berkaitan dengan data science.
Kereen mas !! terus kembangkan