積分線形予測残差 (Integrated linear prediction residuals、ILPR) は、1995年にT. V. Ananthapadmanabhaにより提案された効果的な特徴であり、音声源信号に非常に近似している[2]。このことはエポックまたは声門が閉まる瞬間を正確に推定するのに非常に有効であることが分かった[3]。A. G. RamakrishnanらはILPRの離散コサイン変換係数には、メル周波数ケプストラム係数を補う話者情報が含まれていることを示した[4]。Plosion指数はT. V. Ananthapadmanabhaらにより閉鎖-破裂変化を特徴付けるために導入された時間領域の特徴である違うスカラーである[5]。
1952年、ロマーン・ヤーコブソン、Gunnar Fant、モリス・ハレが"Preliminaries to Speech Analysis"を著し、音響音声学と音韻論を結びつけた。この小さい本に続けて、1960年に出されたFantの "Acoustic Theory of Speech Production" は長きにわたり学会・産業界のいずれにおいても発話音響学の主要な理論的基礎であった(Fantは電話産業に大いに携わっていた)。この分野を形作った重要な人物としては他に"Acoustic Phonetics"を著したケネス・スティーブンズや、藤村靖、ピーター・ラディフォギッドがいる。
Clark, John; & Yallop, Colin. (1995). An introduction to phonetics and phonology (2nd ed.). Oxford: Blackwell. ISBN0-631-19452-5.
Johnson, Keith (2003). Acoustic and Auditory Phonetics (Illustrated). 2nd edition by Blackwell Publishing Ltd. ISBN1-4051-0122-9 (hardback: alkaline paper); ISBN1-4051-0123-7 (paperback: alkaline paper).
Ladefoged, Peter (1996). Elements of Acoustic Phonetics (2nd ed.). The University of Chicago Press, Ltd. London. ISBN0-226-46763-5 (cloth); ISBN0-226-46764-3 (paper).
Fant, Gunnar. (1960). Acoustic theory of speech production, with calculations based on X-ray studies of Russian articulations. Description and analysis of contemporary standard Russian (No. 2). s'Gravenhage: Mouton. (2nd ed. published in 1970).
Hardcastle, William J.; & Laver, John (Eds.). (1997). The handbook of phonetic sciences. Oxford: Blackwell Publishers. ISBN0-631-18848-7.
Hermann, L. (1890) "Phonophotographische Untersuchungen". Pflüger's Archiv. f. d. ges Physiol. LXXIV.
Jakobson, Roman; Fant, Gunnar; & Halle, Morris. (1952). Preliminaries to speech analysis: The distinctive features and their correlates. MIT acoustics laboratory technical report (No. 13). Cambridge, MA: MIT.
Flanagan, James L. (1972). Speech analysis, synthesis, and perception (2nd ed.). Berlin: Springer-Verlag. ISBN0-387-05561-4.
Kent, Raymond D.; & Read, Charles. (1992). The acoustic analysis of speech. San Diego: Singular Publishing Group. ISBN1-879105-43-8.
Pisoni, David B.; & Remez, Robert E. (Eds.). (2004). The handbook of speech perception. Oxford: Blackwell. ISBN0-631-22927-2.
Stevens, Kenneth N. (2000). Acoustic Phonetics. Current Studies in Linguistics (No. 30). Cambridge, MA: MIT. ISBN0-262-69250-3.
Stevens, Kenneth N. (2002). “Toward a model for lexical access based on acoustic landmarks and distinctive features”. The Journal of the Acoustical Society of America111 (4): 1872–1891. doi:10.1121/1.1458026. PMID12002871.
Ladefoged, Peter and Sandra F. Disner (2012) Vowels and Consonants, Wily-Blackwell, 『母音と子音:音声学の世界に踏み出そう』田村幸誠・貞光宮城訳、開拓社、2021年. ISBN 978-4-7589-2286-9
^T. V. Ananthapadmanabha, “Acosutic factors determining perceived voice quality,” in Vocal fold Physiology - Voice quality control, O.Fujimura and M. Hirano, Eds. San Diego, Cal.: Singualr publishing group, 1995, ch. 7, pp. 113–126.
^A. P. Prathosh, T. V. Ananthapadmanabha, and A. G. Ramakrishnan, “Epoch extraction based on integrated linear prediction residual using plosion index,” IEEE Transactions on Audio, Speech and Language Processing, 2013, Vol. 21, Iss. 12, pp. 2471-2480.
^A G Ramakrishnan, B Abhiram and S R Mahadeva Prasanna, “Voice source characterization using pitch synchronous discrete cosine transform for speaker identification,” Journal of the Acoustical Society of America Express Letters, Vol. 137(), pp., 2015.
^T V Ananthapadmanabha, A P Prathosh, A G Ramakrishnan, “Detection of the closure-burst transitions of stops and affricates in continuous speech using the plosion index,” Journal of the Acoustical Society of America, Vol. 137, 2015.