Pengertian audio dan media audio – Audio adalah suara atau bunyi yang dihasilkan oleh getaran suatu benda, agar dapat tertangkap oleh telinga manusia getaran tersebut harus kuat minimal 20 kali/detik.
Suara yaitu suatu getaran yang dihasilkan oleh gesekan , pantulan dan lain-lain, antara benda-banda. Sedangkan gelombang yaitu suatu getaran yang terdiri dari Amplitudo dan juga waktu. Suara dibangun oleh periode, Apabila Tidak Berarti itu bukanlah Suara.
Definisi audio yang lainnya adalah merupakan salah satu elemen yang penting, karena ikut berperan dalam membangun sebuah sistem Komunikasi dalam bentuk suara, ialah suatu sinyal elektrik yang akan membawa unsur-unsur bunyi didalamnya. Audio itu terbentuk melalui beberapa tahap, diantaranya: tahap pengambilan atau penangkapan suara,
sambungan transmisi yang membawa bunyi, amplifier dan lain-lain.
sambungan transmisi yang membawa bunyi, amplifier dan lain-lain.
A. Inilah jenis-jenis audio
Macam-macam atau Jenis-jenis audio, terdapat berbagai macam audio yang dikelompok berdasarkan media ataupun perangkat yang sering gunakan, diantaranya:
- Audio Streaming adalah suatu istilah yang dipakai untuk mendengarkan siaran langsung atau live melalui jaringan internet. Seperti contohnya: Winamp (MP3), RealAudio (RAM) dan juga Liquid Radio.
- Pengertian audio visual adalah suatu istilah yang digunakan untuk seperangkat soundsystem yang dilengkapi dengan tampilan gambar, biasanya dipakai untuk presentasi.
- Audio Modem Riser (AMR) adalah suatu istilah yang dipakai untuk sebuah kartu plug-in untuk motherboard intel yang memuat sirkuit audio ataupun Modem.
B. Berikut ini jenis format audio
Inilah Jenis-jenis format audio, ada berbagai macam format atau ekstensi audio yang dapat ditemui sehari-hari, tapi yang umumnya dikenal oleh masyarakat antara lain :
- MP3 adalah (MPEG, Audio Layer 3) suatu format audio yang dikembangkan oleh Fraunhoper Institude dengan memiliki bitrate 128 kbps. Dalam waktu yang singkat MP3 menjadi format paling populer dalam dunia musik digital, sebab ukuran filenya yang kecil dan juga kualitasnya tidak kalah dengan CD Audio.
- WAV adalah suatu format audio yang merupakan standar suara dari de-facto di Windows. Awalnya format jenis ini dijadikan jembatan untuk penghubung file yang akan dikonversi keformat yang lainnya. Tetapi seiring berkembangnya zaman, banyak para pengguna yang melewati tahap ini, pengguna dapat mengkonversi file secara langsung ke format yang diinginkannya. Format ini jarang sekali dipakai sebab ukuran filenya yang lumayan agak besar.
- AAC (Advanced Audio Coding) adalah suatu format audio yang menjadi standar untuk MPEG (Motion Picture Experts Group). Sejak standar MPEG-2 diberlakukan pada tahun 1997, sample rate yang ditawarkan sampai dengan 96 KHz atau 2 (dua) kali sample rate MP3 (MPEG, Audio Layer 3). Kualitas format audio dengan ini cukup baik sekali, bahkan pada bitrate yang paling rendah sekalipun. Salah satu pengguna format audio ini ialah iTunes, toko musik online besutan Apple dan juga piranti atau perangkat pendukung terkemuka untuk format audio ini juga berasal dari produknya Apple yaitu Ipod.
- WMA (Windows Media Audio) adalah suatu format audio yang ditawarkan oleh perusahaan teknologi terbesar di dunia yaitu Microsoft Corporation. Format audio yang satu ini sangat disukai oleh vendor musik online sebab dukungannya terhadap DRM (Digital Right Management) yaitu suatu fitur yang dipakai untuk mencegah pembajakan musik. Selain itu, menurut isu atau gosip yang beredar format audio ini memiliki kualitas yang lebih baik dari pada formaat AAC maupun MP3.
- Ogg Vorbis adalah satu-satunya format audio yang garatis atau terbuka untuk umum. Kelebihannya ialah terletak pada kualitas audio yang tinggi walaupun pada bitrate rendah sekalipun.
- Real Audio adalah suatu format audio yang sering ditemui pada bitrate rendah. Format jenis ini dikembangkan oleh RealNetworks, digunakan untuk layanan streaming audio pada bitrate 128 kbps atau lebih dengan memakai standar AAC MPEG-4.
- MIDI adalah suatu format audio yang biasanya digunakan untuk ringtone pada handphone, sebab ukuran filenya yang kecil tapi sayangnya format audio ini hanya cocok untuk suara yang dihasilkan oleh synthesizer.
C. Teknik kompresi vidio
Metode Kompresi Audio
Metode kompresi lossless yang masih tradisional seperti Huffman dan LZW. Penggunaanya tidak bekerja dengan baik pada kompresi audio, sama seperti sebagian kompresi untuk gambar. Sehingga dibentuklah sebuah metode kompresi untuk mengatasi keterbatasan pada metode kompresi lossless, yaitu disebut dengan metode kompresi lossy.
Ciri-ciri kompresi lossy pada audio
1. Adaptive Differetial Pulse Code Modulation, contohnya CCITT G.721,16 tau 32 Kbit/sec
Melakukan encode dua atau lebih sinyal yang berbeda, perbedaan kuantisasi pada encode tersebut adalah kehilangan sinyal data suara.
Mengadaptasi terhadap kuantisasi terhadap beberapa bit dapat digunakan asalkan isi data sinyal suara sedikit.
2. Linier Predective Coding (LPC) difungsikan untuk menyesuaikan sinyal data yang ada dengan sinyal suara manusia, kemudian mengirimkan parameter model suara tersebut ketempat tujuan, seperti sebuah computer yang dapat berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps.
3.Code Excited Linear Predicator (CELP) bekerja mirip seperti LPC, tetapi ada tambahan CELP dapat memancarkan data suara yang salah, sedangkan PLC tidak, contohnya mutu percakapan audio pada kecepatan 4,8 kbps
Metode kompresi audio yang lain juga bisa berupa :
1. Metode Transformasi
Menggunakan algoritma seperti MDCT (Modified Discreate Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB.
2. Metode Waktu
Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps.
Sistem suara manusia memiliki keterbatasan, dimana resolusi frekuensinya terbatas. Keragaman leber frekuensi dapat dibedakan menjadi critical bands. Jika frekuensi yang ada kuramng dari 100 Hz maka diangap frekuensi audio yang rendah, dan apabila lebih dari 4 kHz disebut frekuensi audio yang tinggi. Kesemuanya frekuensi audio dapat dibagi menjadi 25 critical bands.
Satuan frekuensi suara dapat diubah menjadi nilai satuan yang baru yaitu bark,di mana;
Bark = jangkauan satu critical band
Untuk frekuensi < 500 Hz, dapat diubah menjasi Bark Untuk frekuensi > 500 Hz, adalah Bark
Metode kompresi lossless yang masih tradisional seperti Huffman dan LZW. Penggunaanya tidak bekerja dengan baik pada kompresi audio, sama seperti sebagian kompresi untuk gambar. Sehingga dibentuklah sebuah metode kompresi untuk mengatasi keterbatasan pada metode kompresi lossless, yaitu disebut dengan metode kompresi lossy.
Ciri-ciri kompresi lossy pada audio
1. Adaptive Differetial Pulse Code Modulation, contohnya CCITT G.721,16 tau 32 Kbit/sec
Melakukan encode dua atau lebih sinyal yang berbeda, perbedaan kuantisasi pada encode tersebut adalah kehilangan sinyal data suara.
Mengadaptasi terhadap kuantisasi terhadap beberapa bit dapat digunakan asalkan isi data sinyal suara sedikit.
2. Linier Predective Coding (LPC) difungsikan untuk menyesuaikan sinyal data yang ada dengan sinyal suara manusia, kemudian mengirimkan parameter model suara tersebut ketempat tujuan, seperti sebuah computer yang dapat berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps.
3.Code Excited Linear Predicator (CELP) bekerja mirip seperti LPC, tetapi ada tambahan CELP dapat memancarkan data suara yang salah, sedangkan PLC tidak, contohnya mutu percakapan audio pada kecepatan 4,8 kbps
Metode kompresi audio yang lain juga bisa berupa :
1. Metode Transformasi
Menggunakan algoritma seperti MDCT (Modified Discreate Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB.
2. Metode Waktu
Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps.
Sistem suara manusia memiliki keterbatasan, dimana resolusi frekuensinya terbatas. Keragaman leber frekuensi dapat dibedakan menjadi critical bands. Jika frekuensi yang ada kuramng dari 100 Hz maka diangap frekuensi audio yang rendah, dan apabila lebih dari 4 kHz disebut frekuensi audio yang tinggi. Kesemuanya frekuensi audio dapat dibagi menjadi 25 critical bands.
Satuan frekuensi suara dapat diubah menjadi nilai satuan yang baru yaitu bark,di mana;
Bark = jangkauan satu critical band
Untuk frekuensi < 500 Hz, dapat diubah menjasi Bark Untuk frekuensi > 500 Hz, adalah Bark
Teknik Kompresi Audio dengan Format MPEG
Beberapa fakta mengenai format MPEG :
MPEG-1: 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunkan untuk video dan 0,3 Mbits/sec digunkan untuk audio, nilai ini lebih kecil dibandingkan dengan CD audio yang belum dikompresi sebesar 44,100 samples/sec * 16 bits/sample * 2 channel lebih dari 1,4 Mbits/sec.
Jangkauan Faktor kompresi dari MPEG-1 adalah dari 2,7 s/d 24. Sehingga dengan kompresi rasio sebesar 6:1 untuk 16 bit stereo dan frekuensi 48 Khz didapatkan kapasitas rate data sebesar 256 kbit/sec, ini merupakan suara yang sangat baik didengar oleh telinga manusia.
MPEG audio mendukung frekuensi sebesar 32 kHz, 44,1 kHz dan 48 kHz.
Mampu bekerja pada satu atau dua buah kanal, dari empat jenis suara, antara lain:
Monophonic (single audio channel)
Dual Monophonic, dua buah cahanel yang berbeda dan tidak ada kaitan satu sama lain
Stereo, untuk kanal stereo adalah dua buah kanal adalah pengabungan beberapa bit, tapi tidak menggunakan koding jont stereo
joint stereo, mengambil nilai yang paling baik dari jenis suara stereo, bisanya lebih dari dua buah kanal (channel)
Algoritma MPEG Audio
Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 kHz, suara dibagi menjadi 32 subband frekuensi.
Memberikan pembatas pada masing-masing frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi).
Jika sinyal suara terlalu rendah, maka tidak dilakukan encode pada sinyal suara tersebut.
Diberikan bit parity yang digunakan untuk mengecek apakah data tersebut rusak atau tidak (yang mungkin disebabkan oleh gangguan/noise), apabila rusak, maka bit tersebut akan digantikan bit yang jenisnya sama dengan bit terdekatnya
Fungsi masing-masing lapisan adalah sebagai berikut :
Lapisan 1 : fungsi dari lapisan ini adalah melakukan penyaringan pada tiap frame dengan model DCT dan melakukan pengelompokan terhadap sinyal yang memepunyai bandwidth yang sama.
Lapisan 2 : menggunakan 3 frame dalam filter sehingga total pada 3 fame tersebut ada 1152 sample.
Lapisan 3: membuat critical band yang paling baik untuk frekuensi yang tidak sama dengan menggunakan model psychoacoustic yang didalamnya terdapat efek masking , dimana efek masking diambil untuk menghitung nilai strereo redudancy, dan juga menggunakan Huffman coder.
Kompresi Audio MP3
Asal-usul MP3 dimulai dari penelitian IIS-FHG (Institut Integriette Schaltungen-Fraunhofer Gesellschaft), sebuah lembaga penelitian terapan di Munich, Jerman dalam penelitian coding audio perceptual. Penelitian tersebut menghasilkan suatu algoritma yang menjadi standard sebagai ISO-MPEG Audio Layer-3 (MP3).
Teknik Kompresi MP3
Beberapa karakteristik dari MP3 memanfaatkan kelemahan pendengaran manusia.
1. Model psikoakustik
Model psikoakustik adalah model yang menggambarkan karakteristik pendengaran manusia.
Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi 20 Hz s/d 20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti itu tidak perlu dikodekan.
2. Auditory masking
Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo yang jauh lebih tinggi.
3. Critical band
Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.
4. Joint Stereo
Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.
Beberapa persyaratan dari suatu encoder/decoder MP3:
Ukuran file terkompresi harus sekecil mungkin.
Kualitas suara file yang telah terkompresi haruslah sedekat mungkin dengan file asli yang belum dikompresi.
Tingkat kesulitan rendah, sehingga dapat direalisasikan dengan aplikasi yang mudah dibuat dan perangkat keras yang ‘sederhana’ dengan konsumsi daya yang rendah
5. Filter Bank,
adalah kumpulan filter yang berfungsi memfilter masukan pada frekuensi tertentu, sesuai dengan critical band yang telah didefinisikan. Filter yang dipakai adalah gabungan dari filter bank polyphase dan Modified Discrete Cosine Transform (MDCT).
6. Perceptual Model,
dapat menggunakan filter bank terpisah atau penggabungan antara perhitungan nilai energi dan filter bank utama. Keluaran model ini adalah nilai masking treshold. Apabila noise berada dibawah masking treshold, maka hasil kompresi tidak akan dapat dibedakan dari sinyal aslinya.
7. Quantization/Coding,
merupakan proses kuantisasi setelah sinyal disampling. Proses ini dilakukan oleh power-law quantizer, yang memiliki sifat mengkodekan amplitudo besar dengan ketepatan rendah, dan dimasukkannya proses noise shaping. Setelah itu nilai yang telah dikuantisasi dikodekan menggunakan Huffman Coding.
8. Encoding Bitstream,
merupakan tahap terakhir dimana bit-bit hasil pengkodean sampling sinyal disusun menjadi sebuah bitstream.
Beberapa fakta mengenai format MPEG :
MPEG-1: 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunkan untuk video dan 0,3 Mbits/sec digunkan untuk audio, nilai ini lebih kecil dibandingkan dengan CD audio yang belum dikompresi sebesar 44,100 samples/sec * 16 bits/sample * 2 channel lebih dari 1,4 Mbits/sec.
Jangkauan Faktor kompresi dari MPEG-1 adalah dari 2,7 s/d 24. Sehingga dengan kompresi rasio sebesar 6:1 untuk 16 bit stereo dan frekuensi 48 Khz didapatkan kapasitas rate data sebesar 256 kbit/sec, ini merupakan suara yang sangat baik didengar oleh telinga manusia.
MPEG audio mendukung frekuensi sebesar 32 kHz, 44,1 kHz dan 48 kHz.
Mampu bekerja pada satu atau dua buah kanal, dari empat jenis suara, antara lain:
Monophonic (single audio channel)
Dual Monophonic, dua buah cahanel yang berbeda dan tidak ada kaitan satu sama lain
Stereo, untuk kanal stereo adalah dua buah kanal adalah pengabungan beberapa bit, tapi tidak menggunakan koding jont stereo
joint stereo, mengambil nilai yang paling baik dari jenis suara stereo, bisanya lebih dari dua buah kanal (channel)
Algoritma MPEG Audio
Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 kHz, suara dibagi menjadi 32 subband frekuensi.
Memberikan pembatas pada masing-masing frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi).
Jika sinyal suara terlalu rendah, maka tidak dilakukan encode pada sinyal suara tersebut.
Diberikan bit parity yang digunakan untuk mengecek apakah data tersebut rusak atau tidak (yang mungkin disebabkan oleh gangguan/noise), apabila rusak, maka bit tersebut akan digantikan bit yang jenisnya sama dengan bit terdekatnya
Fungsi masing-masing lapisan adalah sebagai berikut :
Lapisan 1 : fungsi dari lapisan ini adalah melakukan penyaringan pada tiap frame dengan model DCT dan melakukan pengelompokan terhadap sinyal yang memepunyai bandwidth yang sama.
Lapisan 2 : menggunakan 3 frame dalam filter sehingga total pada 3 fame tersebut ada 1152 sample.
Lapisan 3: membuat critical band yang paling baik untuk frekuensi yang tidak sama dengan menggunakan model psychoacoustic yang didalamnya terdapat efek masking , dimana efek masking diambil untuk menghitung nilai strereo redudancy, dan juga menggunakan Huffman coder.
Kompresi Audio MP3
Asal-usul MP3 dimulai dari penelitian IIS-FHG (Institut Integriette Schaltungen-Fraunhofer Gesellschaft), sebuah lembaga penelitian terapan di Munich, Jerman dalam penelitian coding audio perceptual. Penelitian tersebut menghasilkan suatu algoritma yang menjadi standard sebagai ISO-MPEG Audio Layer-3 (MP3).
Teknik Kompresi MP3
Beberapa karakteristik dari MP3 memanfaatkan kelemahan pendengaran manusia.
1. Model psikoakustik
Model psikoakustik adalah model yang menggambarkan karakteristik pendengaran manusia.
Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi 20 Hz s/d 20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti itu tidak perlu dikodekan.
2. Auditory masking
Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo yang jauh lebih tinggi.
3. Critical band
Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.
4. Joint Stereo
Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.
Beberapa persyaratan dari suatu encoder/decoder MP3:
Ukuran file terkompresi harus sekecil mungkin.
Kualitas suara file yang telah terkompresi haruslah sedekat mungkin dengan file asli yang belum dikompresi.
Tingkat kesulitan rendah, sehingga dapat direalisasikan dengan aplikasi yang mudah dibuat dan perangkat keras yang ‘sederhana’ dengan konsumsi daya yang rendah
5. Filter Bank,
adalah kumpulan filter yang berfungsi memfilter masukan pada frekuensi tertentu, sesuai dengan critical band yang telah didefinisikan. Filter yang dipakai adalah gabungan dari filter bank polyphase dan Modified Discrete Cosine Transform (MDCT).
6. Perceptual Model,
dapat menggunakan filter bank terpisah atau penggabungan antara perhitungan nilai energi dan filter bank utama. Keluaran model ini adalah nilai masking treshold. Apabila noise berada dibawah masking treshold, maka hasil kompresi tidak akan dapat dibedakan dari sinyal aslinya.
7. Quantization/Coding,
merupakan proses kuantisasi setelah sinyal disampling. Proses ini dilakukan oleh power-law quantizer, yang memiliki sifat mengkodekan amplitudo besar dengan ketepatan rendah, dan dimasukkannya proses noise shaping. Setelah itu nilai yang telah dikuantisasi dikodekan menggunakan Huffman Coding.
8. Encoding Bitstream,
merupakan tahap terakhir dimana bit-bit hasil pengkodean sampling sinyal disusun menjadi sebuah bitstream.
sumber:http://www.pengertianku.net/2014/11/pengertian-audio-dan-media-audio-secara-lengkap.html
No comments:
Post a Comment