6 Contoh Penerapan Data Science Dalam Kehidupan Sehari-Hari
Data science-mungkin saat ini teman-teman sudah tidak asing lagi dengan kata data science. Atau mungkin ada yang belum tahu apa itu data science? Kalian bisa baca di ulasan singkatnya di data science dan beberapa artikel terkait di dalamnya.
Pada artikel kali ini saya coba merangkumkan dari buku yang pernah saya baca judulnya: Introduction to Machine Learning: A Guide for Data Scientist tulisan Andreas C. muller dan Sara Guido tentang beberapa permasalahan yang bisa diselesaikan oleh Machine learning.
Dalam tiap membangun dan menguji suatu model/algoritma machine learning pasti melibatkan aktivitas pengumpulan, pembersihan, menganalisis, dan menafsirkan data sehingga bisa dimengerti. Sehingga tugas seorang data scientist sungguh sangat penting dalam proses pengembangan/penerapan model suatu machine learning.
Berikut beberapa 6 contoh penerapan data science dalam kehidupan sehari-hari.
Membaca Karakter Tulisan Tangan: mengidentifikasi kode pos dari tulisan tnagan berupa angka pada amplop surat.
Input data berupa sebuah scan tulisan tangan kode pos pada suatu amplop, dan output yang diharapkan adalah bilagan yang menjadi kode pos suatu daerah. Nah, tugas data science adalah membuat sejumlah data set, yakni sekian banyak sekali foto/scan tulisan tangan kode pos pada amplop surat.
Bukan hanya mengumpulkan data sets berupa kumpulan banyak sekali foto/scan tulisan tangan alias gambar digital, tapi juga bagaimana menyajikannya agar menjadi data yang bisa dimengerti oleh model yang akan dibangun untuk suatu machine learning.
Tugas seorang data science di sini, mulai mengumpulkan data sets, membersihkan, dan menyajikannya menjadi bilangan yang berarti bagi proses selanjutnya. Misalnya merepresentasikan data menjadi numeric tertentu yang konsisten.
Baca Juga: Materi Data Science Yang Harus Dikuasai untuk Pemula
Menentukan apakah terdapat suatu kanker berdasarkan suatu gambar kesehatan
Dalam contoh penerapan data science yang kedua ini juga hamper sama dengan yang pertama, dimana data yang ditangani berupa gambar. Dari gambar ini akan digunakan oleh suatu algoritma machine learning untuk menentukan apakah pasien yang dengan gambar tertentu memiliki potensi kanker atau tidak.
Tugas seorang data scientist di sini harus mengumpulkan, mengolah data, berupa data base gambar-gambar hasil tes kesehatan (medical images). Selain itu, diperlukan pendapat ahli kesehatan untuk membantu memberikan pendapatnya apakah suatu gambar tes kesehatan seorang mengandung kanker atau tidak.
Mendeteksi aktivitas mencurigakan atau bersifat merusak (fraud) pada suatu transaksi kartu kredit
Tugas seorang data scientist adalah mengolah data berupa rekaman transaksi suatu kartu kredit yang nantinya akan digunakan pada proses menguji model machine learning sehingga bisa memberikan output apakah suatu transaksi berpotensi mencurigakan/merusak atau tidak.
Tugas seorang data scientist di sini adalah mengumpulkan sejumlah data set berupa history/record transaksi ketika seorang pengguna melaporkan terjadi kartu kredit melaporkan telah terajadi transaksi mencurigakan/fraudulent.
Mengidentifikasi topik dari sekumpulan post pada suatu blog
Jika data berupa teks atau kumpulan artikel yang tidak memiliki kelompok atau tema/topik yang serupa. Bagimana cara kita membuat klasifikasi topik dari sekian banyak artikel?
Menarik untuk dijawab bukan? Jawaban dari hal ini adalah penerpan data science dalam membangun model machine learning khususnya unsupervised learning. Ini akan coba saya bahas di artikel khusus nantinya di artikel Machine Learning.
Membagi pelanggan kedalam kelompok-kelompok dengan preferensi serupa
Hampir sama pada contoh data science di atas, di sini tugas seorang data scientist adalah mengumpulkan, mengolah, dan menyajikan data yang berasal dari data catatan pelanggan. Misalnya, untuk suatu situs shopping, kelompoknya bisa berupa, “gamer”, “orang tua”, “alat kesehatan”, dan lain-lain.
Persis seperti contoh data science identifikasi topik suatu artikel pada website, dalam kasus ini kita juga tidak tahu kemungkinan apa saja yang menjadi output. Contoh ini juga termasuk kedalam apa yang kita kenal sebagai algoritma machine learning unsupervised.
Mendeteksi pola akses yang tak normal pada suatu website
Contoh data penerapan data science terkahir adalah pada pendeteksian pola akses yang abnormal pada suatu situs. Pola abnormal di sini bisa berupa perusakan atau bugs dan lain-lain. Tiap pola yang tidak normal bisa berbeda-beda.
Dan bahkan seorang data scientist akan bekerja dengan data yang tidak sepenuhnya dapat dengan mudah dikelompokkan/kategorikan karena tidak memiliki catatan sepenunya tentang mana yang termasuk perilaku normal mana yang tidak.
Pekerjaan yang sangat menantang bukan? Oleh karena tidak ada output yang jelas (defenitif) maka contoh data penerapan science semacam ini masuk ke kelasifikasi masalah unsupervised pada proses machine learningnya.
Baca Juga: Jurusan Data Science
Kesimpulan
Demikian contoh data science dalam kehidupan sehari-hari dan tugas seorang data scientist di dalamnya.
Intinya, tugas seorang data scientist adalah mengumpulkan data, mengolah data (membersihkan data, membuat menjadi data yang mudah dipahami, dan lain-lain), dan menyajikan agar menjadi berbarti alias dapat dipahami baik oleh manusia terutama harus bisa dipahami dan bisa digunakan untuk implementasi model suatu algoritma machine learning.
Masih banyak lagi sebenarnya tugas dari seorang data scientist. Nanti akan saya buat beberapa tugas mendasar dan awal seorang data scientist pada artikel selanjutnya.