MPEG-1 Audio Layer 3 atau lebih dikenal sebagai MP3 adalah salah satu format berkas pengodean suara yang memiliki kompresi yang baik (meskipun bersifat lossy) sehingga ukuran berkas bisa memungkinkan menjadi lebih kecil. Berkas ini dikembangkan oleh seorang insinyur JermanKarlheinz Brandenburg. MP3 memakai pengodean Pulse Code Modulation (PCM). MP3 mengurangi jumlah bit yang diperlukan dengan menggunakan model psychoacoustic untuk menghilangkan komponen-komponen suara yang tidak terdengar oleh manusia.
MP3 memakai sebuah transformasi hybrid untuk mentransformasikan sinyal pada ranah waktu ke sinyal pada ranah frekuensi:
Filter polyphasequadrature 32-band
36 atau 12 MDCT (modified discrete cosine transform), dengan ukuran dapat dipilih secara independen untuk sub-band 0…1 dan 2…31
Postproses aliasing reduction
Standar MPEG-1 tidak menspesifikasikan secara spesifik cara melakukan encode MP3. Sebaliknya, algoritme decode serta format file didefinisikan secara spesifik. Yang ingin mengimplementasikan encoder MP3 harus membuat sendiri algorima untuk menghilangkan bagian dari informasi pada file audio asal (atau pada representasi MDCT pada ranah frekuensi).
Karena itu, maka cara encode setiap encoder MP3 berlainan dan menghasilkan kualitas hasil yang berlainan juga. Hal yang harus diperhatikan adalah dari semua encoder yang ada, terdapat encoder yang bagus untuk bitrate tinggi maupun encoder yang bagus untuk bitrate rendah.
MP3 mempunyai beberapa batasan/limit:
Bit rate terbatas, maksimum 320 kbit/s (beberapa encoder dapat menghasilkan bit rate yang lebih tinggi, tetapi sangat sedikit dukungan untuk mp3-mp3 tersebut yang memiliki bit rate tinggi)
Resolusi waktu yang digunakan mp3 dapat menjadi terlalu rendah untuk sinyal-sinyal suara yang sangat transient, sehingga dapat menyebabkan noise.
Resolusi frekuensi terbatasi oleh ukuran window yang panjang kecil, mengurangi efisiensi coding
Tidak ada scalefactorband untuk frekuensi di atas 15,5 atau 15,8 kHz
Mode jointstereo dilakukan pada basis per frame
Delay bagi encoder/decoder tidak didefinisikan, sehingga tidak ada dorongan untuk gaplessplayback (pemutaran audio tanpa gap). Tetapi, beberapa encoder seperti LAME dapat menambahkan metadata tambahan yang memberikan informasi kepada MP3 player untuk mengatasi hal itu.
Desain
Struktur file
File MP3 terdiri dari bingkai MP3, yang terdiri dari header dan blok data.[7] Urutan bingkai ini disebut aliran dasar.[8] Karena adanya "reserve bit", frame bukanlah elemen independen dan biasanya tidak dapat diekstraksi pada batas frame yang berubah-ubah. Blok data MP3 berisi informasi audio (terkompresi) dalam bentuk frekuensi dan amplitudo.[9]
Pengkodean dan penguraian kode
Kompresi MP3 bekerja dengan mengurangi keakuratan komponen suara tertentu,[10] yang diyakini (menurut analisis psikoakustik) berada di luar kemampuan pendengaran sebagian besar orang.[11][12] Metode ini biasanya disebut sebagai pengkodean perseptual atau pemodelan psikoakustik. Informasi audio yang tersisa kemudian direkam dengan cara yang ekonomis menggunakan algoritme MDCT dan FFT.
Kualitas
Dalam pengkodean audio lossy, seperti membuat aliran data MP3, ada pertukaran antara jumlah data yang dihasilkan dan kualitas suara. Pengguna yang membuat MP3 memilih kecepatan bit, yang menentukan berapa kilobyte per detik audio yang diperlukan. Semakin tinggi bit rate, semakin besar aliran data MP3 dan biasanya akan semakin mendekati rekaman aslinya.[13][14] Jika kecepatan data terlalu rendah, artefak kompresi (t. е. suara yang tidak ada dalam rekaman asli) dapat didengar saat pemutaran. Beberapa suara sulit dikompresi karena keacakan dan perubahan volume yang tiba-tiba. Ketika suara tersebut dikompresi, artefak seperti dering atau gema biasanya terdengar.