Apa itu Data Lineage ?
Foto : ewsolutions
Data Lineage (Silsilah data) terdiri dari metodologi dan alat (tool) yang mengekspos siklus hidup data dan membantu menjawab pertanyaan
seputar siapa, kapan, di mana, mengapa, dan bagaimana data berubah.
Data Lineage adalah disiplin dalam manajemen metadata dan sering kali merupakan kemampuan unggulan dari katalog data
yang memungkinkan konsumen memahami konteks data yang mereka gunakan untuk pengambilan keputusan dan tujuan bisnis lainnya.
Foto : Fox
Sebagai contohnya, Sistem GPS yang memberikan petunjuk arah di setiap belokan, dan gambaran umum visual dari rute yang dipetakan di sana (Google Maps)
Baca Juga :
AI Bisa Membuat Gambar Melalui Deskripsi Tertulis?
Ia juga kian digunakan dalam organisasi sebagai praktik atau alat dalam memproses bisnis penting, misalnya :
- Satu bank meningkatkan efisiensi sebesar 80 kali lipat lebih cepat dan menghemat biaya lebih dalam menyelesaikan Data Lineage di 100 jenis aplikasi berbeda.
- Data Lineage memainkan peran penting dalam manajemen rantai pasokan, seperti memberikan transparansi dari pertanian ke grosir kepada pembeli.
- Lembaga nonprofit dapat melacak donasi yang diberikan ke program tertentu dan memberikan transparansi tentang bagaimana hasilnya memberikan dampak.
Kunci sukses mungkin menetapkan prioritas dan menentukan tujuan yang wajar, terutama untuk organisasi dengan banyak sumber data, teknologi, dan pola penggunaan
4 Fungsi Utama Data Lineage
- Sebagai Syarat Kepatuhan
Banyak perusahaan atau organisasi yang harus menerapkan Data Lineage agar tetap dinilai baik dan patuh oleh regulator pemerintah.
Sumber data dalam manajemen risiko dan pelaporan diperlukan bagi perusahaan perdagangan pasar modal untuk mendukung regulasi BCBS 239 dan MiFID II.
Untuk bank besar, mengotomatiskan ekstraksi garis keturunan dari sistem sumber dapat menghemat waktu TI yang signifikan dan mengurangi risiko.
Dalam uji klinis farmasi, standar ADaM membutuhkan ketertelusuran antara analisis dan data sumber.
Peraturan lainnya, termasuk Peraturan Perlindungan Data Umum (GDPR), Perlindungan Informasi Pribadi dan Undang-Undang Dokumen Elektronik (PIPEDA),
dan Undang-Undang Privasi Konsumen California (CCPA), juga mengharuskan lebih banyak organisasi untuk menerapkan tata kelola data dan kemampuan garis keturunanya,
terutama untuk melacak data pribadi dan data sensitif.
2. Budaya Berbasis Data
Suatu Organisasi yang mengembangkan program ilmu data warga, membuat dasbor indikator kinerja utama, mengelola lingkungan hybrid BI (Bussines Intelligence),
dan mengambil langkah lain untuk menjadi organisasi berbasis data dapat dengan mudah tersandung pada tantangan Data Lineage.
Saat data keuangan di dasbor berubah secara signifikan, dapat dipastikan bahwa para eksekutif atau atasan pasti ingin mengetahui apa yang menyebabkan perubahan tersebut.
Ilmu data warga dan program BI swalayan lainnya sulit untuk dijalankan jika para ahli di bidangnya tidak mempercayai data tersebut.
Tools pada Data Lineage bisa membantu mereka lebih memahami sumber data, aliran,
dan aturan seputar data yang mereka kueri, laporkan, atau susun ke dalam visualisasi data.
3. Transparasi Digital
Organisasi yang mengembangkan produk, layanan, dan alur kerja berupaya meningkatkan kualitas data, membuat hub data master, atau berinvestasi dalam pengelolaan data master.
Pendekatan ini biasanya mencakup garis keturunan data sebagai kemampuan untuk memberikan transparansi pada aturan dan perubahan bisnis.
Contoh kasus penggunaan mencakup kemampuan pelanggan yang semakin matang, penskalaan program pemasaran digital,
memprioritaskan inisiatif pengalaman pelanggan, mengoptimalkan etalase e-commerce, dan menciptakan transparansi ke dalam rantai pasokan.
4. Analisis dan Machine Learning (Pembelajaran Mesin)
Data Lineage juga penting untuk mendukung modelop dan siklus hidup pembelajaran mesin.
Menangkap dan menganalisis Data Lineage dapat membantu menentukan kapan data yang cukup baru atau yang diubah memerlukan model pelatihan ulang dan mengurangi penyimpangan model.
Namun, sama pentingnya untuk melacak siklus hidup model lengkap karena model pembelajaran mesin sering kali menjadi masukan untuk layanan, aplikasi, dan analitik.
Semakin banyaknya organisasi yang mulai berinvestasi dalam data, analitik, dan pembelajaran mesin, Data Lineage menjadi praktik tata kelola data yang semakin penting.