Menurut Jogiyanto (2005:403) ”Normalisasi (Normalization) adalah Proses untuk mengorganisasikan file untuk menghilangkan grup elemen yang berulang-ulang”. Konsep dan teknik normalisasi ini dikenalkan oleh Dr.E.F Codd di papernya pada tahun 1970 dan 1972. Dalam papernya, E.F. Codd mendefinisikan struktur data yang baru yaitu disebut dengan struktur data hubungan (relational data structure). Istilah data hubungan menunjukkan suatu struktur data yang mempunyai hubungan dengan elemen-elemen data lainnya, baik dalam satu atau dalam file lainnya.
Sumber : Dok.Pribadi |
Database dengan struktur data hubungan dapat digambarkan dalam bentuk tabel dua dimensi. Kolom dari tabel menunjukkan atribut dari file. Atribut ini menunjukkan item data atau field. Kumpulan dari nilai field disebut domain. Masing-masing baris dari record didalam tabel disebut dengan istilah tuple. Tiap-tiap record dapat mempunyai satu kunci yang unik dimana record ini dapat diidentifikasikan. Field yang menjadi kunci tersebut disebut dengan field kunci (key field).
Ada beberapa kunci (key function) yang harus digunakan untuk proses pencarian, penyaringan, hapus dan lain sebagainya, diantaranya:
1. Kunci calon (Candidate Key).
Kunci calon atau kunci kandidat adalah salah satu atribut atau satu set minimal atribut yang mengidentifikasikan secara unik suatu kejadian yang spesifik dari suatu entity.
2. Kunci Primer (Primary Key).
Kunci primer adalah satu atribut atau satu set minimal atribut yang tidak hanya mengidentifikasi secara unik suatu kejadian yang spesifik, tetapi juga dapat mewakili setiap kejadian dari suatu entity.
3. Kunci Alternatif (Alternatife Key).
Kunci alternatif, kunci kandidat yang tidak dipakai sebagai primary key.
4. Kunci Tamu (Foreign Key).
Kunci tamu adalah satu atribut atau satu set minimal atribut yang melengkapi satu relationship (hubungan) yang menunjukkan kepada induknya. Hubungan antara entity induk dan anak adalah hubungan satu dengan banyak (one to many relationship).
Salah satu membuat normalisasi adalah untuk memastikan bahwa model data relasional dapat berjalan dengan baik. Bentuk-bentuk normalisai terdiri dari beberapa bagian diantaranya:
1. Bentuk Normal Pertama (First Normal Form).
Bentuk ini merupakan kumpulan data yang akan direkam, tidak ada keharusan mengikuti suatu format tertentu, bisa saja data tidak lengkap atau terduplikasi. Data dikelompokkan apa adanya sesuai dengan kedatangannya.
2. Bentuk Normal Pertama (First Normal Form).
Bentuk normal kesatu terpenuhi jika sebuah tabel tidak memiliki atribut dengan domain nilai yang sama. Pada tahap ini dilakukan penghilangan beberapa grup elemen ya ng berulang agar menjadi satu harga tunggal yang berinteraksi diantara setiap baris pada suatu tabel dan setiap atribut harus mempunyai nilai data yang atomic (bersifat atomic value). Syarat normal kesatu (I NF) antara lain:
- Setiap data dibentuk dalam flat file, data dibentuk dalam satu record demi sarecord nilai dari field berupa ”automic value”.
- Tidak ada set atribut yang berulang atau bernilai ganda.
- Telah ditentukan primary key untuk tabel/relasi tersebut.
- Tiap atribut hanya memiliki satu pengertian.
3 . Bentuk Normal Kedua (Second Normal Form)
Bentuk normal kedua terpenuhi jika pada sebuah tabel, semua atribut yang tidak termasuk dalam key primer memiliki ketergantungan fungsional (KF) pada key primer secara utuh. Sebuah tabel dikatakan memenuhi 2NF, jika ketergantungannya hanya bersifat parsial (hanya bergantung pada sebagian dari key primer).
4 . Bentuk Normal Ketiga (Third Normal Form)
Bentuk normal tahap ketiga (3NF) merupakan kriteria alternatif, jika kriteria BCNF yang ketat tidak dapat terpenuhi. Sebuah tabel dikatakan berada dalam Bentuk Normal tahap Ketiga (3NF), jika untuk setiap KF dengan notasi X → A, dimana A mewakili semua atribut tunggal didalam tabel yang tidak ada didalam X. Maka X haruslah superkey pada tabel tersebut, atau A merupakan bagian dari key primer pada tabel tersebut.
5 . Bentuk Normal Keempat (Fourth Normal Form)
Penerapan aturan Normalisai pada tahap ketiga sesungguhnya sudah sangat memadai untuk menghasilkan tabel-tabel yang berkualitas baik. Namun demikian, dari sejumlah literatur dapat pula dijumpai adanya pembahasan tentang Bentuk Normal tahap Keempat (4NF) dan Bentuk Normal tahap Kelima (5NF).
Bentuk Normal tahap Keempat (4NF) berkaitan dengan sifat ketergantungan banyak nilai (Multivalued defendency) pada suatu tabel yang merupakan pengembangan dari ketergantungan fungsional. Sedangkan Bentuk Normal tahap Kelima (5NF) (merupakan nama lain dari project-join Normal Form atau PJNF) berkenaan dengan ketergantungan relasi antar tabel (Join Defendency).