Archive for September 2010

Contoh Proposal

Klasifikasi Dokumen Teks dengan Metode Na´ve Bayes

Latar belakang
Internet adalah penyimpan segala sumber informasi dari penyedia sumber informasi di seluruh dunia. Ragam dalam isi, tujuan dan format elektronik terkumpul menjadi satu. Kumpulan ini tidak tersebar di berbagai macam lokasi. Untuk mendapatkan sumber informasi di dalamnya, biasanya pengguna menggunakan mesin pencari, lalu menentukan sendiri sumber informasi yang sesuai dengan kebutuhan.

Hasil pencarian yang dilakukan oleh mesin pencari didasarkan pada algoritma tertentu yang membaca isi atau deskripsi tentang sumber informasi. Hal ini dikarenakan sumber informasi yang tersedia di Internet tidak tersusun secara terstruktur, dan tidak selalu lengkap dengan atribut-atribut pengenal seperti pengarang, penerbit dan tahun terbit. Dengan demikian, penentuan keabsahan suatu sumber merupakan keahlian tersendiri yang harus dimiliki oleh pengguna.
Di pihak lain, perpustakaan yang juga merupakan penyedia sumber informasi senantiasa mengelola sumber informasi dengan melakukan klasifikasi. Klasifikasi ini membantu pengguna untuk mengalokasi sumber informasi secara fisik dan mendapatkan informasi tentang sumber informasi tersebut secara sederhana. Belajar dari hal tersebut, jika sumber informasi di Internet diklasifikasikan berdasarkan atribut-atribut yang melekat pada sumber informasi tersebut, maka pencarian dan penentuan keabsahan sumber informasi di Internet akan lebih mudah. Klasifikasi memanfaatkan atribut pengarang, penerbit dan isi dari sumber informasi.

Didasari alternatif di atas, maka dalam penelitian ini akan dibangun suatu aplikasi berbasis komputer yang berfungsi untuk melakukan klasifikasi terhadap sumber informasi elektronik di Internet secara selektif. Metode yang digunakan untuk mendukung proses klasifikasi ini adalah Na´ve-Bayes, dan TF-IDF. Klasifikasi yang dilakukan berdasarkan beberapa kelas yang ditentukan sebagai kasus penelitian yaitu ekonomi dan bisnis, teknologi informasi, kesehatan, pendidikan dan politik.

Rumusan Masalah
Penelitian ini akan menghasilkan program untuk melakukan klasifikasi sumber informasi elektronik di Internet dengan menerapkan metode Naive-Bayes dan metode TF-IDF. Metode Naive-Bayes melakukan klasifikasi berdasarkan hasil pembobotan dengan metode TF-IDF. Hasil yang diharapkan adalah sumber informasi dapat terkelompok dalam 5 kelas yang ditentukan yaitu: kelas Ekonomi dan bisnis, teknologi informasi, kesehatan, pendidikan dan politik.

Tujuan Penelitian
Penelitian ini memiliki tujuan dalam pengembangan ilmu dan pemberian manfaat yaitu :
1.untuk mengembangkan bidang ilmu penambangan teks dengan menerapkan metode Naive-Bayes dan TF-IDF
2.untuk memberikan hasil penelusuran sumber informasi yang sesuai dengan klasifikasi yang ditetapkan

Landasan Teori
Metode Naive-Bayes
Naive Bayes adalah metode yang digunakan untuk mengklasifikasikan ,..........dst

Metode TF-IDF
TF-IDF merupakan metode yang.....

Tokenisasi
Proses tokenisasi merupakan proses untuk menghilangkan........

Stemming
Untuk mengubah kata menjadi kata dasar proses stemming.......


Spesifikasi Sistem
Sistem yang akan menjadi hasil dari penelitian ini memiliki kemampuan membaca setiap kata dalam file teks, membangun kumpulan kata dasar, menghitung bobot kata berdasarkan TF-IDF dan mengklasifikasikan file teks ke klasifikasi yang sudah ditentukan.

Untuk membangun program ini maka software dan hardware yang digunakan adalah sebagai berikut:
1.Software : bahasa pemrograman Visual Basic, .... ,......
2.Hardware : komputer dengan prosesor ..., dengan RAM , ..... dan hardisk

Tahap Pelaksanaan Penelitian
____________________________________________________________________________
Observasi ________XXXX|XXXX
Pengumpulan Data______XXXX|XXXX|
Perancangan_________________XXXXX|XXXX|XXXX
Implementasi_________________________________XXXXX|XXXX
Pengujian_______________________________________________XXXX|XXXX|XXXX
Analisis hasil_______________________________________________________XXXX|XXXX
Dokumentasi_____XXXX|XXXX|XXXX|XXXX|XXXX|XXXX|XXXX|XXXXX|XXXX|XXXX|XXXX
_____________________________________________________________________________
Daftar Pustaka
Weiss, Sholom. (2005). Text Mining: Predictive Methods for Analyzing Unstructured Information.NY, New York: Springer.
Baeza-Yates, Ricardo.(1999). Modern Information Retrieval. Harlow,Edinburgh: Pearson Education Limited.

28 Sep, 2010 | othie |

© 2007 yoursite.com | Designed by DesignsByDarren
Ported to Nucleus CMS: Suvoroff