Berlakunya Undang-undang Pelindungan Data Pribadi (PDP) di Indonesia memberikan tantangan bagi para data engineer, "Bagaimana caranya agar data pribadi bisa lebih terlindungi". Privacy Enhancing Technology (PET) adalah teknologi dan berbagai metode untuk meningkatkan privacy dari data pribadi yang dikelola suatu perusahaan.
PET sering juga disebut sebagai privacy preserving technology alih-alih sebagai privacy enhancing, yang artinya teknologi ini adalah untuk menjaga data yang seharusnya private tetap private. PET pada dasarnya adalah tools untuk memproteksi data, dalam hal ini penerapannya khusus pada data pribadi, dibandingkan data protection tools yang digunakan secara umum untuk memproteksi data sensitive baik pribadi maupun yang bukan.
PET melibatkan berbagai metode seperti enkripsi, hashing, anonimisasi, access control, differential privacy, synthetic data generation, noise addition, etc. Teknologi ini biasanya digunakan pada data-oriented strategy dari program pelindungan data pribadi. (Selain dat-oriented strategy, kita mengenal juga process-oriented strategy dari pelindungan data pribadi).
Artikel ini membahas data-oriented strategy karena ini berkaitan erat dengan PET, sedangkan process-oriented strategi akan kita bahas pada artikel lainnya (YASAI).
Data-oriented strategy secara umum dapat dikelompokkan menjadi 4 kategori, yaitu:
- Separate (pisahkan data)
- Minimize (kurang kurangin data)
- Abstact (bikin blur data)
- Hide (Sembunyikan)
Separate
Strategi memisahkan bisa dilakukan dengan dua cara, yaitu dengan mendistribusikan atau dengan mengisolasi data. Data bisa di-distribusikan (disebar) dengan cara logical atau physical. Secara logical artinya kita menggunakan tools untuk mengatur siapa yang berhak mengakses data dan siapa yang tidak. Sedangkan pemisahan secara fisik, artinya data-data sensitive disimpan pada database terpisah, server terpisah.
Isolasi adalah cara lain untuk melakukan pemisahan data, dengan meletakan data pada jaringan terpisah sehingga hanya user-user tertentu yang dapat mengaksesnya.
Minimize
Strategi kedua dari data-oriented strategy dalam pelindungan data pribadi adalah dengan meminimilasisasi data. Mulai dari data collection, data use, disclose sampai retention. Minimalisasi data dapat dilakukan dengan beberapa cara, yaitu:
- Exclude
- Select
- Strip
- Destroy
Exclude, adalah mengecualikan data-data yang tidak penting untuk keperluan data collection. Jika tidak diperlukan dalam pemrosesan data, tidak perlu diminta. Misalnya kalau tidak memerlukan data tanggal lahir untuk keperluan pemrosesan data, jangan dimasukkan ke dalam form data entry!
Select, artinya hanya mengambil data-data yang akan diproses. Jika data pribadi sudah dikumpulkan, dan akan digunakan untuk analisa data, misalnya, maka hanya pilih atribut-atribut dari data pribadi yang diperlukan saja. Bisa jadi dalam suatu perusahaan ada beberapa penggunaan data, dan masing-masing memerlukan data yang berbeda. Strategi Select memastikan bahwa data yang dikirimkan ke seorang data analyst sudah terfilter sesuai keperluannya.
Strip adalah menghilangkan data yang tidak diperlukan sebelum dikirimkan ke pihak yang akan melakukan pemrosesan data. Jika Select bicara tentang atribut data, strip bicara tentang rows data. Baris data yang tidak diperlukan untuk pemrosesan lebih lanjut dihilangkan.
Metode terakhir dari strategi minimize adalah dengan menghapus (menghancurkan) data yang sudah tidak diperlukan lagi sesuai peruntukannya pada saat data collection. Penghapusan data juga diperlukan bagi data-data pribadi yang tidak sengaja terkoleksi atau ketika ada subyek data yang meminta untuk dihapuskan.
Menghapus data perlu kehati-hatian, khususnya ketika data sudah pernah digunakan. Karena bisa saja data tersebut sudah tersimpan di cloud atau bahkan di komputer desktop.
Abstract
Abstracting data melibatkan PET untuk membuat dataset menjadi tidak jelas secara individu, alias menyamarkan. Ada beberapa cara yang bisa dilakukan
- Group
- Summarize
- Perturb
Grouping data dilakukan misalnya dalam hal umur, daripada menyimpan umur persisnya seperti 25 tahun, dapat dilakukan grouping kelompok umur : 21 - 30 tahun.
Summarize adalah dengan melakukan agregasi data
Perturb adalah dengan proses menambahkan data noise ke dalam dataset sehingga mengurangi spesifik nya data
Hide
Nah ini.
- Restrict
- Mix
- Obfuscate
- Dissociate
- Masking
Lanjut nanti ya