Let Find Out..

Minggu, 13 Maret 2011

Kompresi AUDIO

Audio
Kompresi mekanikal atau gelombang longitudinal yang merambat melalui medium. Medium atau zat perantara ini dapat berupa zat cair, padat, gas. Jadi, gelombang bunyi dapat merambat misalnya di dalam air, batu bara, atau udara.Audio (suara) terbentuk dengan karakteristik Amplitudo, Frekuensi dan Pitch.

Amplitudo (intensitas) : berhubungan dengan variasi tekanan gelombang. Kekuatan suara audio yang diterima tergantung pada amplitudo.

Frekuensi
Jumlah dari suatu besaran periodik  yang terbentuk secara identik per detiknya.
Frekuensi suara dapat digunakan untuk membedakan suara rendah dan suara tinggi
 Frekuensi dinyatakan dalam satuan Hertz (Hz)

Pitch
Dapat digunakan untuk membedakan dan  mengskalakan signal-signal dengan ketinggian dan intensitas yang identik.
Picth berbeda untuk setiap sumber suara
Perbedaan antara suara keras dan lembut berhubungan dengan vibrasi udara yang mentransmisi suara ke telinga
Intensitas suara (akustik) dinyatakan dalam decibel (dB)

Pengertian Kompresi Audio
  Salah satu bentuk kompresi databertujuan untukmengecilkan ukuran file audio dengan metode
  Lossy format:Vorbis,MP3,MPEG-1;
  Loseless format: FLAC digunakan oleh audio engineer

 Lossless Audio Codec
  Lossless ialah proses dekompresi yang menghasilkan data yang sama dengan yang semula
  Lossless audio codec tidakmempunyaimasalahdalamkualitassuara, penggunaannyadapatdifokuskanpada:
  Kecepatankompresidandekompresi
  Derajatkompresi
  Dukunganhardware dansoftware

Lossy Audio codec
  Penggunaannya difokuskan pada:
  Kualitas audio
  Faktor kompresi
  Kecepatan kompresi dan dekompresi
  Inherent latency of algorithm (pentingbagireal-time streaming)
  Dukungan hardware dan software

Metode Kompresi Audio
  Metode Transformasi
      Menggunakan algoritma seperti MDCT (Modified Discrete Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB.
  Metode Waktu
      Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps


Kompresi Audio
  Signal Audio digital (sampling dan kuantisasi)
      Sampling rate (jumlah sampel per detik),
        - 8 kHz telephony, μ-law encoding, SUN Audio
         - 32 kHz Digital Radio Broadcast
         - 44,1 kHz Audio-CD
         - 48 kHz Digital Audio Tape (DAT)
      Bit rate (jumlah bit per detik).
    - signal musik stereo adalah 2*16 bit/sampel atau
       sekitar 1.4 Mbps untuk audio-CD
    - signal suara vokal adalah 8 bit/sampel
      Jumlah channel (mono / stereo / multichannel)

Teknik kompresi Audio dengan format MPEG
  MPEG (Moving Picture Expert Group)
  MPEG-1 menggunakan bandwidth 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunakan untuk video sedangkan 0,3 Mbits/sec digunakan untuk audio.
      Nilai 0,3 Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2 channel > 1,4 Mbits/sec yang hanya terdiri dari suara saja.
  Teknik Kompresi Audio dengan Format MPEG

Algoritma MPEG Audio

Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 kHz, suara dibagi menjadi 32 subband frekuensi.
Memberikan pembatas pada masing-masing frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi)
Jika sinyal suara terlalu rendah, maka tidak dilakukan encode pada sinyal suara tersebut
Diberikan bit parity yang digunakan untuk mengecek apakah data tersebut rusak atau tidak (yang mungkin disebabkan oleh gangguan / noise), apabila rusak, maka bit tersebut akan digantikan bit yang jenisnya sama dengan bit terdekatnya.
Algoritma MPEG Audio

MPEG audio compression dan decompression

Terminologi
Filter Bank : adalah kumpulan filter yang berfungsi memfilter masukan pada frekuensi tertentu, sesuai dengan critical band yang telah didefinisikan. Filter yang dipakai adalah gabungan dari filter bank polyphase dan Modified Discrete Cosine Transform (MDCT)
Perceptual Model : dapat menggunakan filter bank terpisah atau penggabungan antara perhitungan nilai energi dan filter bank utama. Keluaran model ini adalah nilai masking treshold. Apabila noise berada dibawah masking treshold, maka hasil kompresi tidak akan dapat dibedakan dari sinyal aslinya.
Quantization/Coding : merupakan proses kuantisasi setelah sinyal disampling. Proses ini dilakukan oleh power-law quantizer, yang memiliki sifat mengkodekan amplitudo besar dengan ketepatan rendah, dan dimasukkannya proses noise shaping. Setelah itu nilai yang telah dikuantisasi dikodekan menggunakan Huffman Coding.
Encoding Bitstream : merupakan tahap terakhir dimana bit-bit hasil pengkodean sampling sinyal disusun menjadi sebuah bitstream.


Tidak ada komentar: