Analisa Struktur Kalimat Bahasa Indonesia dengan Menggunakan Pengurai Kalimat Berbasis Linguistic String Analysis

abstraks: 

Posted April 13th, 2008 by odetoyamaSistem Informasi abstraks:
Tujuan utama penelitian ini adalah menganalisa struktur kalimat bahasa Indonesia dengan menggunakan pengurai kalimat berbasis linguistic string analysis. Struktur sintaks kalimat ini sangat diperlukan bagi pengembangan suatu sistem pemrosesan bahasa alami khususnya untuk pemrosesan bahasa Indonesia.
Struktur sintaks yang dibangun pada penelitian ini mengacu pada aturan-aturan sintaks yang terdapat di dalam tata bahasa baku bahasa Indonesia.Untuk menguji kebenaran aturan-aturan sintaks yang telah dibuat, dibuat juga pengurai sintaks yang memuat aturan-aturan sintaks tersebut. Pembuatan pengurai sintaks kalimat bahasa Indonesia ini menggunakan alat bantu Lex-Yacc.

KATA PENGANTAR i
ABSTRAK ii
DAFTAR ISI iii
DAFTAR GAMBAR v
DAFTAR TABEL vi
BAB I PENDAHULUAN 1
1.1 LATAR BELAKANG MASALAH 1
1.2 TUJUAN PENELITIAN 3
1.3 PEMBATASAN MASALAH 4
1.4 METODOLOGI PENELITIAN 5
1.5 SISTEMATIKA PENULISAN 6
BAB II STRUKTUR KALIMAT BAHASA INDONESIA 8
2.1 KALIMAT DAN UNSUR-UNSURNYA 8
2.1.1 Ciri-Ciri Subjek 9
2.1.2 Ciri-Ciri Predikat 11
2.1.3 Ciri-Ciri Objek 12
2.1.4 Ciri-Ciri Pelengkap 13
2.1.5 Ciri-Ciri Keterangan 14
2.2 KALIMAT TUNGGAL DAN PERUBAHANNYA 17
2.2.1 Kalimat Dasar 17
2.2.2 Pola Kalimat Dasar 17
2.2.3 Kalimat Aktif 19
2.2.4 Kalimat Pasif 20
2.2.5 Perluasan Unsur 21
2.3 KALIMAT MAJEMUK 23
2.3.1 Kalimat Majemuk Setara 24
2.3.2 Kalimat Majemuk Bertingkat 24
BAB III ANALISA DAN PERANCANGAN 26
3.1 PENENTUAN KELAS-KELAS KATA 26
3.2 RANCANGAN PENGURAI STRUKTUR KALIMAT 30
3.2.1 Aturan Kalimat Deklaratif 31
3.2.2 Aturan String Subjek Kalimat 32
3.2.3 Aturan String Predikat Kalimat 35
3.2.4 Aturan String Objek Kalimat 39
3.2.5 Aturan String Pelengkap dan Keterangan Kalimat 40
3.2.6 Aturan Sentence Adjunct 41
3.3 RANCANGAN KAMUS KELAS KATA 43
3.4 RANCANGAN STRUKTUR DATA 44
BAB IV IMPELEMENTASI DAN UJI COBA 46
4.1 IMPLEMENTASI 46
4.1.1 Implementasi Penganalisa Leksikal 46
4.1.2 Implementasi Pemeriksa Kamus Kelas Kata 47
4.1.3 Implementasi Penganalisa Sintaks 48
4.1.4 Implementasi Struktur Data Pengurai Sintaks 49
4.2 UJI COBA 51
4.2.1. Uji Coba Tahap Pertama 51
4.2.2 Uji Coba Tahap Kedua 54
BAB V KESIMPULAN DAN SARAN 67
5.1 KESIMPULAN 67
5.2 SARAN 69
REFERENSI 72
LAMPIRAN 1 ATURAN SINTAKS BAHASA INDONESIA 73
LAMPIRAN 2 KELAS KATA 77
LAMPIRAN 3 KALIMAT-KALIMAT YANG BERHASIL DIURAIKAN 78
LAMPIRAN 4 KALIMAT-KALIMAT YANG TIDAK DAPAT DIURAIKAN 85

BAB I
PENDAHULUAN

1.1 LATAR BELAKANG MASALAH
Bahasa adalah salah satu komponen yang paling penting dalam kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari satu generasi ke generasi lain. Sedangkan dalam bentuk lisan, bahasa berperan dalam mengarahkan tingkah laku manusia sehari-hari dalam berhubungan dengan orang lain.
Salah satu motivasi dalam penelitian bahasa alami adalah bahwa kemampuan pemrosesan bahasa alami akan mengubah cara penggunaan komputer [Alle94]. Karena kebanyakan pengetahuan manusia tersimpan dalam bentuk bahasa, komputer yang dapat mengerti bahasa alami dapat mengakses informasi ini. Selain itu, antar muka sistem komputer yang kompleks yang menggunakan bahasa alami dapat diakses oleh setiap orang. Sistem yang seperti ini akan lebih fleksibel dan intelligent dan sangat mungkin diterapkan pada teknologi komputer sekarang ini.
Penelitian dalam bidang pemrosesan bahasa alami sudah banyak dilakukan. Namun kebanyakan penelitian tersebut dilakukan terhadap bahasa Inggris. Penelitian bahasa alami yang dilakukan terhadap bahasa Indonesia masih sedikit dilakukan. Tentunya penelitian ini selayaknya dilakukan oleh orang Indonesia sendiri.
Salah satu komponen terpenting dalam pemrosesan bahasa alami adalah pengurai (parser) struktur kalimat. Pengurai sintaks kalimat ini memberi indikasi bagaimana hubungan antar kata dalam satu kalimat. Struktur ini juga mengidentifikasikan bagaimana kata-kata bersatu membentuk frase, kata-kata yang
mana yang melakukan modifikasi kata yang lain dan kata-kata yang mana yang merupakan kata-kata inti dalam satu kalimat. Dengan informasi ini, komputer dapat menginterpretasikan kalimat sehingga seolah-olah komputer dapat mengerti kalimat tersebut.

Proses penguraian kalimat pada bahasa manusia mirip dengan proses penguraian tata bahasa pemrograman dalam dunia komputer. Perbedaan yang mendasar pada keduanya adalah tata bahasa dalam dunia komputer merupakan tata bahasa yang bebas konteks (context free grammar), sedangkan tata bahasa pada bahasa Indonesia merupakan tata bahasa alami yang peka terhadap konteks (context sensitive). Pendefinisian tata bahasa yang peka terhadap konteks untuk diproses oleh komputer merupakan hal yang sangat kompleks. Oleh karena itu, salah satu alternatif penyelesaian masalah ini adalah analisa konteks terhadap suatu kalimat dalam bahasa alami dipisahkan dengan analisa sintaks [Alle94]. Walaupun analisa semantik dipisahkan dari analisa sintaks, penguraian struktur kalimat dalam bahasa alami tetap tidak sederhana. Oleh karena itu, setelah dilakukan penguraian struktur kalimat dalam bahasa alami, pengurai perlu melakukan validasi terhadap struktur hasil penguraian tersebut.

Penelitian dan pembuatan pengurai sintaks kalimat untuk bahasa Indonesia sudah dilakukan oleh Iskak Hendrawan. Namun penelitian ini hanya terbatas pada kalimat-kalimat tunggal sederhana karena fokus penelitiannya lebih mengarah kepada pengujian penggunaan suatu metode penguraian kalimat yaitu metode linguistic string analysis terhadap kalimat bahasa Indonesia. Oleh karena itu, penulis mencoba melakukan penelitian yang cukup mendalam dengan memfokuskan penelitian pada pembuatan aturan sintaks kalimat bahasa Indonesia sesuai dengan aturan tata bahasa baku. Setelah itu, penulis mencoba membuat suatu pengurai sintaks kalimat untuk bahasa Indonesia untuk menguji aturan-aturan sintaks yang sudah dibuat sebelumnya.

Beberapa masalah dalam penguraian bahasa Indonesia adalah sebagai berikut:
• Representasi kalimat.
Masalah ini bertumpu pada formalisasi yang akan digunakan untuk menspesifikasikan kalimat-kalimat yang benar dalam bahasa Indonesia. Harus ada suatu mekanisme bagaimana suatu kalimat direpresentasikan, sehingga komputer mendapatkan informasi untuk menginterpretasikan kalimat tersebut.
• Pendefinisian aturan sintaks.
Untuk mendapatkan struktur penguraian suatu kalimat, pengurai memerlukan informasi aturan-aturan sintaks kalimat dalam bahasa Indonesia. Aturan-aturan sintaks ini didefinisikan dalam suatu format tertentu yang mudah dimengerti oleh manusia. Agar dapat dipakai oleh komputer untuk melakukan penguraian kalimat-kalimat bahasa Indonesia, diperlukan alat bantu yang dapat menerjemahkan aturan-aturan sintaks tersebut ke dalam bahasa pemrograman yang dimengerti olehnya.
• Kamus kata.
Kamus kata ini diperlukan untuk informasi kelas kata dari kata yang akan diuraikan.

1.2 TUJUAN PENELITIAN
Tujuan penelitian dalam tugas akhir ini adalah menganalisa struktur kalimat bahasa Indonesia dengan menggunakan pengurai kalimat berbasis linguistic string analysis. Sebagai sampel penelitian, digunakan kalimat-kalimat yang terdapat pada abstrak-abstrak penelitian yang dilakukan di Fakutas ilmu komputer UI.

1.3 PEMBATASAN MASALAH
Struktur sintaks kalimat bahasa Indonesia yang dibuat dalam penelitian ini adalah struktur sintaks kalimat yang sesuai dengan aturan sintaks tata bahasa baku bahasa Indonesia. Struktur ini mengindikasikan bagaimana kata-kata dalam suatu kalimat bahasa Indonesia saling berkaitan. Struktur ini juga mengindikasikan bagaimana kata-kata tersebut membentuk suatu frase, bagaimana suatu kata melakukan modifikasi terhadap kata-kata yang lain dan juga merepresentasikan kata-kata apa yang menjadi inti dari suatu kalimat.

Representasi sintaks kalimat bahasa Indonesia yang dilakukan pengurai ini berdasarkan tata bahasa yang bebas konteks. Dengan kata lain, representasi struktur kata suatu kalimat tidak tergantung pada makna atau konteks kata lain penyusun kalimat tersebut. Oleh karena itu, penguraian kalimat berdasarkan aturan sintaks bahasa Indonesia ini juga memberi arti bahwa tugas akhir ini tidak melakukan penguraian kalimat secara semantik.

Kalimat-kalimat yang dapat diuraikan berdasarkan bentuk sintaksisnya terbatas pada kalimat deklaratif (kalimat berita). Berdasarkan kelengkapannya, kalimat yang diuraikan terbatas pada kalimat lengkap tunggal dan kalimat tunggal yang mengalami perluasan unsur kalimat seperti subjek, predikat, objek, pelengkap, atau keterangan atau kalimat majemuk bertingkat. Kalimat yang mengalami peniadaan unsur-unsurnya tidak diuraikan. Kalimat yang dapat diuraikan adalah kalimat yang digunakan dalam bahasa tulisan sebab kalimat yang sering mengalami peniadaan unsur adalah kalimat yang digunakan dalam bahasa lisan.
Hasil keluaran dari pengurai ini adalah struktur pohon pengurai (parse tree) dari struktur kalimat jika kalimat masukan sesuai dengan tata bahasa baku bahasa Indonesia. Jika kalimat masukan tidak sesuai dengan tata bahasa baku, maka struktur pohon tidak akan terbentuk. Pengecekan validasi atau analisa kesalahan struktur pohon urai secara lebih detil tidak dilakukan dalam tugas akhir ini. Analisa kesalahan kalimat masukan yang tidak dapat dibuat struktur pohon urainya juga tidak dilakukan.

1.4 METODOLOGI PENELITIAN
Strategi penguraian yang digunakan dalam penelitian ini adalah penguraian yang bebas konteks (context free). Hal ini dilakukan karena strategi ini sesuai dengan komputasi komputer dan sudah sangat dikenal dalam bidang ilmu komputer untuk menguraikan kalimat berdasarkan sintaks kalimat tersebut [Sage81].
Pada penelitian ini, juga dipelajari metoda penguraian linguistic string analysis yang telah digunakan oleh Iskak Hendrawan di dalam penelitiannya. Linguistic string adalah urutan simbol-simbol yang merepresentasikan kelas-kelas kata dalam suatu kalimat [Sage81]. Tiap-tiap kalimat memiliki inti kalimat dengan urutan simbol-simbol yang sangat sederhana yang dinamakan elementary center string. Kalimat-kalimat kompleks dapat dibentuk dari kalimat inti dengan cara menambahkan kata-kata tertentu yang dikenal dengan nama adjunct string pada beberapa bagian tertentu dalam kalimat inti tersebut.
Setelah itu, penulis melakukan penelitian terhadap struktur kalimat bahasa Indonesia yang baku. Penelitian terhadap struktur kalimat bahasa Indonesia ini meliputi kalimat-kalimat dasar yang dimiliki oleh bahasa Indonesia. Kemudian penulis juga mempelajari perluasan dari kalimat dasar bahasa Indonesia yaitu kalimat yang beberapa unsur kalimatnya diperluas dengan menggunakan pola-pola tertentu.

Setelah mempelajari sintaks bahasa Indonesia, penulis mencoba membuat aturan-aturan sintaks untuk kalimat sederhana dengan menggunakan definisi BNF. Aturan-aturan sintaks untuk kalimat sederhana itu kemudian sedikit demi sedikit dimodifikasi agar dapat menguraikan kalimat yang lebih kompleks. Modifikasi dilakukan dengan menerapkan aturan-aturan linguistic string analysis, dengan mengacu pada pola kalimat bahasa Indonesia yang sudah dipelajari sebelumnya.
Berdasarkan struktur kalimat tersebut, dibuat suatu pengurai kalimat bahasa Indonesia. Proses uji coba kemudian dilakukan terhadap pengurai kalimat untuk mengecek kebenaran aturan-aturan sintaks yang sudah dibuat dan juga untuk melakukan analisa struktur kalimat bahasa Indonesia yang juga merupakan tujuan penelitian ini.

1.5 SISTEMATIKA PENULISAN
Bab pertama memberikan penjelasan tentang latar belakang masalah, tujuan penelitian, ruang lingkup permasalahan dan metode penelitian.

Bab 2 membahas struktur kalimat bahasa Indonesia. Struktur kalimat ini akan digunakan dalam pembuatan aturan-aturan sintaks bahasa Indonesia.

Bab 3 membahas tentang analisa dan perancangan pengurai yang dibuat dalam penelitian ini. Bab ini dimulai dengan penentuan kelas-kelas kata yang digunakan, kemudian perancangan pengurai sintaks, dan perancangan struktur data yang digunakan.

Bab 4 membahas implementasi dan uji coba terhadap pengurai sintaks kalimat bahasa Indonesia. Implementasi dibuat berdasarkan analisa dan perancangan yang telah dijelaskan pada bab sebelumnya. Sub bab uji coba membahas hasil uji coba yang dilakukan terhadap pengurai dengan input kalimat-kalimat yang terdapat pada buku-buku tentang tata bahasa baku bahasa Indonesia dan juga kalimat-kalimat yang terdapat pada abstrak penelitian yang dilakukan di Fakultas Ilmu Komputer UI. Pada bab ini juga dijelaskan analisa terhadap hasil uji coba yang dilakukan pada sampel kalimat bahasa Indonesia yaitu abstrak penelitian yang dilakukan di Fakultas Ilmu Komputer UI.

Bab terakhir membahas tentang kesimpulan dan saran yang merupakan hasil dari penelitian yang telah dilakukan.


Untuk dapat melihat dan mendownload file skripsi lengkap yang dilampirkan pada setiap judul, anda harus menjadi special member, klik Register untuk menjadi free member di Indoskripsi.

Semua Member Special dapat mendownload SELURUH file content yang ada di website ini. Daftarkan diri anda segera. UNLIMITED ACCESS

Google

PELUANG KERJA UNTUK FRESH GRADUATE, MAHASISWA TINGKAT AKHIR, BARU LULUS KULIAH? KLIK DISINI
BUTUH BEASISWA STUDY, BEASISWA PENELITIAN, INFO BEASISWA TERBARU? KLIK DISINI



Jika tertarik untuk memasang iklan di website ini, silahkan klik menu contact
Silahkan baca syarat dan ketentuannyadi sini

Design by xactive -