Hello,. tulisan kali ini sedikit akan bermain dengan data mining, yaitu terkait bagaimana cara kita mengekstrak informasi dari suatu data set dan mentransformasikannya ke dalam bentuk yang mudah dipahami untuk keperluan analisa lebih lanjut. Bayangkan saja jika kita mempunyai ribuan atau mungkin jutaan data, maka menampilkan hanya data statistik beserta distribusinya akan menjadi tidak cukup untuk menjelaskan perilaku (behaviour) dari suatu data set. Sehingga menemukan pola (pattern) atau sejumlah data yang bersifat paling informatif dari sekumpulan data set akan menjadi hal yang saya kira sangat penting untuk dipelajari.
Seperti halnya pada tulisan-tulisan sebelumnya (seperti PSO, ICA, PCA dll), tulisan kali ini lebih menekankan pada bagaimana cara kita menggunakan suatu persamaan ketimbang cara mendapatkan atau menurunkannya (ini kerjaan orang matematik saya kira hehehe). Sedangkan, paper yang akan dibahas pada tulisan kali ini berjudul "Optimal Multi-scale Patterns in Time Series Streams" yang dipublikasi oleh Papadimitriou pada tahun 2006. Ini memang paper yang cukup lama, sekitar 10 tahun yang lalu, namun masih sangat menarik untuk dipelajari dan masih mungkin untuk dikembangkan. Data yang digunakan dalam tulisan ini adalah data pengukuran CO$_2$ di kota Bandung pada bulan Februari 2011. Untuk lebih jelasnya, silahkan baca tulisan ini. Selamat membaca. (program dapat didownload di akhir tulisan ini).
Konsentrasi CO$_2$ bulan Februari 2011 |