Audio
Kompresi mekanikal atau gelombang longitudinal
yang merambat melalui medium. Medium atau zat perantara ini dapat berupa zat
cair, padat, gas. Jadi, gelombang bunyi dapat merambat misalnya di dalam air,
batu bara, atau udara.Audio (suara) terbentuk dengan karakteristik Amplitudo, Frekuensi dan
Pitch.
Amplitudo (intensitas) :
berhubungan dengan variasi tekanan gelombang. Kekuatan suara audio yang
diterima tergantung pada amplitudo.
Frekuensi
Jumlah dari suatu
besaran periodik yang terbentuk secara
identik per detiknya.
Frekuensi suara
dapat digunakan untuk membedakan suara rendah dan suara tinggi
Frekuensi dinyatakan dalam satuan Hertz (Hz)
Pitch
Dapat digunakan untuk membedakan dan mengskalakan signal-signal dengan ketinggian dan
intensitas yang identik.
Picth berbeda
untuk setiap sumber suara
Perbedaan antara
suara keras dan lembut berhubungan dengan vibrasi udara yang mentransmisi suara
ke telinga
Intensitas suara
(akustik) dinyatakan dalam decibel (dB)
Pengertian
Kompresi Audio
— Salah satu bentuk kompresi databertujuan
untukmengecilkan ukuran file audio dengan metode
— Lossy format:Vorbis,MP3,MPEG-1;
— Loseless format: FLAC digunakan oleh audio
engineer
Lossless
Audio Codec
— Lossless ialah proses dekompresi yang
menghasilkan data yang sama dengan yang semula
— Lossless audio codec tidakmempunyaimasalahdalamkualitassuara,
penggunaannyadapatdifokuskanpada:
— Kecepatankompresidandekompresi
— Derajatkompresi
— Dukunganhardware dansoftware
Lossy
Audio codec
— Penggunaannya difokuskan pada:
— Kualitas audio
— Faktor kompresi
— Kecepatan kompresi dan dekompresi
— Inherent latency of algorithm
(pentingbagireal-time streaming)
— Dukungan hardware dan software
Metode
Kompresi Audio
— Metode Transformasi
◦
Menggunakan
algoritma seperti MDCT (Modified Discrete Cosine Transform) untuk
mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat
didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz
dan 96 dB.
— Metode Waktu
◦
Menggunakan LPC (Linier
Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC
akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke
pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia
dengan kecepatan 2,4 kbps
Kompresi Audio
— Signal Audio digital (sampling dan kuantisasi)
◦
Sampling rate
(jumlah sampel per detik),
- 8 kHz telephony, μ-law encoding, SUN
Audio
- 32 kHz Digital Radio Broadcast
- 44,1 kHz Audio-CD
- 48 kHz Digital Audio Tape (DAT)
◦
Bit rate (jumlah
bit per detik).
-
signal musik stereo adalah 2*16 bit/sampel atau
sekitar 1.4 Mbps untuk audio-CD
-
signal suara vokal adalah 8 bit/sampel
◦
Jumlah channel
(mono / stereo / multichannel)
Teknik
kompresi Audio dengan format MPEG
— MPEG (Moving Picture Expert Group)
— MPEG-1 menggunakan bandwidth 1,5 Mbits/sec
untuk audio dan video, dimana 1,2 Mbits/sec digunakan untuk video sedangkan 0,3
Mbits/sec digunakan untuk audio.
◦
Nilai 0,3
Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD
Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2
channel > 1,4 Mbits/sec yang hanya terdiri dari suara saja.
— Teknik Kompresi Audio dengan Format MPEG
Algoritma MPEG Audio
— Menggunakan filter untuk membagi sinyal audio:
misalnya pada 48 kHz, suara dibagi menjadi 32 subband frekuensi.
— Memberikan pembatas pada masing-masing
frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi
(tabrakan frekuensi)
— Jika sinyal suara terlalu rendah, maka tidak
dilakukan encode pada sinyal suara tersebut
— Diberikan bit parity yang digunakan untuk
mengecek apakah data tersebut rusak atau tidak (yang mungkin disebabkan oleh
gangguan / noise), apabila rusak, maka bit tersebut akan digantikan bit yang
jenisnya sama dengan bit terdekatnya.
— Algoritma MPEG Audio
MPEG audio compression dan decompression
Terminologi
— Filter Bank :
adalah kumpulan filter yang berfungsi memfilter masukan pada frekuensi
tertentu, sesuai dengan critical band yang telah didefinisikan. Filter
yang dipakai adalah gabungan dari filter bank polyphase dan Modified
Discrete Cosine Transform (MDCT)
— Perceptual Model : dapat menggunakan filter bank terpisah atau
penggabungan antara perhitungan nilai energi dan filter bank utama. Keluaran
model ini adalah nilai masking treshold. Apabila noise berada dibawah
masking treshold, maka hasil kompresi tidak akan dapat dibedakan dari sinyal
aslinya.
— Quantization/Coding : merupakan proses kuantisasi setelah sinyal
disampling. Proses ini dilakukan oleh power-law quantizer, yang memiliki
sifat mengkodekan amplitudo besar dengan ketepatan rendah, dan dimasukkannya
proses noise shaping. Setelah itu nilai yang telah dikuantisasi
dikodekan menggunakan Huffman Coding.
— Encoding Bitstream : merupakan tahap terakhir dimana bit-bit
hasil pengkodean sampling sinyal disusun menjadi sebuah bitstream.
Tidak ada komentar:
Posting Komentar