BLaCklist CrOniCLe... \(",)?: Kompresi AUDIO

Audio

Kompresi mekanikal atau gelombang longitudinal yang merambat melalui medium. Medium atau zat perantara ini dapat berupa zat cair, padat, gas. Jadi, gelombang bunyi dapat merambat misalnya di dalam air, batu bara, atau udara.Audio (suara) terbentuk dengan karakteristik Amplitudo, Frekuensi dan Pitch.

Amplitudo (intensitas) : berhubungan dengan variasi tekanan gelombang. Kekuatan suara audio yang diterima tergantung pada amplitudo.

Frekuensi

Jumlah dari suatu besaran periodik yang terbentuk secara identik per detiknya.

Frekuensi suara dapat digunakan untuk membedakan suara rendah dan suara tinggi

Frekuensi dinyatakan dalam satuan Hertz (Hz)

Pitch

Dapat digunakan untuk membedakan dan mengskalakan signal-signal dengan ketinggian dan intensitas yang identik.

Picth berbeda untuk setiap sumber suara

Perbedaan antara suara keras dan lembut berhubungan dengan vibrasi udara yang mentransmisi suara ke telinga

Intensitas suara (akustik) dinyatakan dalam decibel (dB)

Pengertian Kompresi Audio

— Salah satu bentuk kompresi databertujuan untukmengecilkan ukuran file audio dengan metode

— Lossy format:Vorbis,MP3,MPEG-1;

— Loseless format: FLAC digunakan oleh audio engineer

Lossless Audio Codec

— Lossless ialah proses dekompresi yang menghasilkan data yang sama dengan yang semula

— Lossless audio codec tidakmempunyaimasalahdalamkualitassuara, penggunaannyadapatdifokuskanpada:

— Kecepatankompresidandekompresi

— Derajatkompresi

— Dukunganhardware dansoftware

Lossy Audio codec

— Penggunaannya difokuskan pada:

— Kualitas audio

— Faktor kompresi

— Kecepatan kompresi dan dekompresi

— Inherent latency of algorithm (pentingbagireal-time streaming)

— Dukungan hardware dan software

Metode Kompresi Audio

— Metode Transformasi

◦ Menggunakan algoritma seperti MDCT (Modified Discrete Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB.

— Metode Waktu

◦ Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps

Kompresi Audio

— Signal Audio digital (sampling dan kuantisasi)

◦ Sampling rate (jumlah sampel per detik),

- 8 kHz telephony, μ-law encoding, SUN Audio

- 32 kHz Digital Radio Broadcast

- 44,1 kHz Audio-CD

- 48 kHz Digital Audio Tape (DAT)

◦ Bit rate (jumlah bit per detik).

- signal musik stereo adalah 2*16 bit/sampel atau

sekitar 1.4 Mbps untuk audio-CD

- signal suara vokal adalah 8 bit/sampel

◦ Jumlah channel (mono / stereo / multichannel)

Teknik kompresi Audio dengan format MPEG

— MPEG (Moving Picture Expert Group)

— MPEG-1 menggunakan bandwidth 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunakan untuk video sedangkan 0,3 Mbits/sec digunakan untuk audio.

◦ Nilai 0,3 Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2 channel > 1,4 Mbits/sec yang hanya terdiri dari suara saja.

— Teknik Kompresi Audio dengan Format MPEG

Algoritma MPEG Audio

— Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 kHz, suara dibagi menjadi 32 subband frekuensi.

— Memberikan pembatas pada masing-masing frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi)

— Jika sinyal suara terlalu rendah, maka tidak dilakukan encode pada sinyal suara tersebut

— Diberikan bit parity yang digunakan untuk mengecek apakah data tersebut rusak atau tidak (yang mungkin disebabkan oleh gangguan / noise), apabila rusak, maka bit tersebut akan digantikan bit yang jenisnya sama dengan bit terdekatnya.

— Algoritma MPEG Audio

MPEG audio compression dan decompression

Terminologi

— Filter Bank : adalah kumpulan filter yang berfungsi memfilter masukan pada frekuensi tertentu, sesuai dengan critical band yang telah didefinisikan. Filter yang dipakai adalah gabungan dari filter bank polyphase dan Modified Discrete Cosine Transform (MDCT)

— Perceptual Model : dapat menggunakan filter bank terpisah atau penggabungan antara perhitungan nilai energi dan filter bank utama. Keluaran model ini adalah nilai masking treshold. Apabila noise berada dibawah masking treshold, maka hasil kompresi tidak akan dapat dibedakan dari sinyal aslinya.

— Quantization/Coding : merupakan proses kuantisasi setelah sinyal disampling. Proses ini dilakukan oleh power-law quantizer, yang memiliki sifat mengkodekan amplitudo besar dengan ketepatan rendah, dan dimasukkannya proses noise shaping. Setelah itu nilai yang telah dikuantisasi dikodekan menggunakan Huffman Coding.

— Encoding Bitstream : merupakan tahap terakhir dimana bit-bit hasil pengkodean sampling sinyal disusun menjadi sebuah bitstream.

BLaCklist CrOniCLe... \(",)?

Minggu, 13 Maret 2011

Kompresi AUDIO

Tidak ada komentar: