Review Mata Kuliah Perolehan Informasi Semester Gasal 2016/2017

Halo.

Perolehan informasi atau yang sering disebut sebagai information retrieval merupakan mata kuliah yang mempelajari pemrosesan teks di dalamnya. Berbeda dengan Natural Language Processing yang mempelajari tatanan/struktur bahasa supaya sistem bisa mengerti bahasa manusia, IR lebih kepada mencari suatu informasi yang sesuai pada suatu sumber (cmiiw). Namun keduanya saling berhubungan, karena NLP juga bisa digunakan dalam proses perolehan informasi. Lebih lanjutnya silakan google sendiri.

Jika disuruh menjelaskan apa yang dipelajari di mata kuliah IR dalam satu kalimat? Jawabannya adalah “Belajar Search Engine”. Walau ga cuma belajar tentang search engine aja, tapi yang paling berasa ya belajar search engine itu. Namun, belajar tentang search engine itu ternyata kompleks banget lho, yang dipelajari di mata kuliah IR pun rasanya sudah sangat kompleks walaupun baru dasar-dasarnya saja dan menggunakan teknik yang tidak terlalu sulit.

Dimulai dengan belajar tentang frekuensi kata yang biasanya terdapat pada suatu dokumen, data statistik, hingga hukum Zipf sebagai pembukaan. Kemudian diselingi dengan membahas bahasa pemrograman Perl. Tidak seperti mata kuliah SI (PDB dan PSP) yang diberikan tutorial, di sini kami diajarkan bahasa Perl dengan menggunakan slide di kelas dan langsung diberi tugas.

Selanjutnya mulai belajar tentang pemrosesan teks, dimulai dengan pemisahan kata, pembetulan ejaan, dan stemming yang kemudian menjadi materi untuk Tugas 1 dan 2. Selanjutnya mempelajari cara pengindeksan dokumen dan membuat model yang sesuai untuk suatu sistem pencarian. Setelah suatu sistem pencarian selesai dibuat, diperlukan adanya evaluasi yang juga dipelajari pada mata kuliah ini.

Setelah UTS, membahas lebih lanjut mengenai pengembangan sistem pencarian, yaitu Relevance Feedback. Selain itu, clustering (yang entah sudah berapa mata kuliah diajarin beginian) juga bisa digunakan untuk mempercepat proses pencarian. Tugas ketiga muncul untuk membuat clustering dengan menggunakan Weka serta melakukan pelabelan dari clustering yang terbentuk.

Di sini kami juga mempelajari tentang topik lain pada IR, yaitu Cross Language Information Retrieval, yaitu suatu sistem yang bisa menerima query dari berbagai bahasa atau menampilkan dokumen pencarian dari berbagai bahasa. Topik lain yang dipelajari yaitu tentang summarization dokumen, sedikit tentang sentimen analysis, dan topik-topik IR lainnya.

Untuk lebih lanjut mengetahui materi kuliah, bisa langsung melihat catatan saya pada link berikut:

Tugas akhir dari mata kuliah ini ialah membuat sistem yang berhubungan dengan mata kuliah ini, yang rata-rata membuat search engine dengan berbagai metode yang telah dipelajari dan berbagai fitur pengembangannya.

So far, mata kuliah ini seru menurut saya, dan sangat dapat sekali ilmunya tentang IR, ditambah dengan diajarkan langsung oleh dosen yang sangat berpengalaman di bidang IR yang juga menjabat sebagai dekan Fasilkom UI saat ini. Tugasnya yang mungkin menurut saya cukup sulit, karena, ya, sekali lagi, saya anak SI dan kemampuan koding saya tak semahir anak jurusan sebelah. (alasan). Anyway, terima kasih kepada Bu Mirna, Kak Dipta, dan (lagi-lagi) Kak Remmy 😀

Kesimpulannya, jangan ragu untuk ambil IR, apalagi yang senang dengan NLP dan pemrosesan teks. Yuk, ambil IR 😀

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s