Teknik pembelajaran tanpa pengawasan tidak memerlukan data berlabel dan dapat menangani kumpulan data yang lebih kompleks. Pembelajaran tanpa pengawasan didukung oleh pembelajaran mendalam dan neural networks atau encoder otomatis yang meniru cara neuron biologis saling memberi sinyal. Alat yang ampuh ini dapat menemukan pola dari data input dan membuat asumsi tentang data apa yang dianggap normal.
Teknik-teknik ini bisa sangat membantu dalam menemukan anomali yang tidak diketahui dan mengurangi pekerjaan memilah-milah kumpulan data yang besar secara manual. Namun, ilmuwan data harus memantau hasil yang dikumpulkan melalui pembelajaran tanpa pengawasan. Karena teknik-teknik ini membuat asumsi tentang data yang dimasukkan, ada kemungkinan teknik-teknik ini salah memberi label pada anomali.
Algoritma machine learning untuk data tidak terstruktur meliputi:
K-means: Algoritma ini merupakan teknik visualisasi data yang memproses titik data melalui persamaan matematis dengan tujuan mengelompokkan titik data yang serupa. "Means", atau data rata-rata, mengacu pada titik-titik di tengah kluster yang terkait dengan semua data lainnya. Melalui analisis data, kluster ini dapat digunakan untuk menemukan pola dan membuat kesimpulan tentang data yang ditemukan di luar kebiasaan.
Isolation forest: Jenis algoritma deteksi anomali ini menggunakan data tanpa pengawasan. Tidak seperti teknik deteksi anomali diawasi yang bekerja dari titik data normal berlabel, teknik ini mencoba mengisolasi anomali sebagai langkah pertama. Mirip dengan “random forest,” algoritma ini menciptakan “struktur keputusan” yang memetakan titik-titik data dan secara acak memilih area untuk dianalisis. Proses ini diulang dan setiap titik menerima skor anomali antara 0 dan 1, berdasarkan lokasinya terhadap titik lainnya; nilai di bawah 0,5 umumnya dianggap normal, sedangkan nilai yang melebihi ambang batas tersebut kemungkinan besar bersifat anomali. Model forest isolation dapat ditemukan di pustaka machine learning gratis untuk Python, scikit-learn.
Mesin vektor pendukung satu kelas (SVM): Teknik deteksi anomali ini menggunakan data pelatihan untuk membuat batas-batas di sekitar apa yang dianggap normal. Titik-titik yang berkerumun dalam batas yang ditetapkan dianggap normal dan yang di luar diberi label sebagai anomali.