Kemometri

Kemometri är en metod att med multivariat statistik optimera eller undersöka kemiska processer. Optimering genom att undersöka en variabel i taget ger ett annat (sub-optimalt) slutresultat än att undersöka hela systemet i en modell. För en praktisk introduktion till multivariat statisk erbjuder webbplatsen miljöstatistik en lättsam introduktion[1]. Kemometri är till sin natur tvärvetenskaplig och använder metoder som ofta används i centrala dataanalytiska discipliner som multivariat statistiktillämpad matematik och datavetenskap, för att ta itu med problem inom kemibiokemimedicinbiologi och kemiteknik. På så sätt speglar det andra tvärvetenskapliga fält, som psykometri och ekonometri.

Bakgrund

Kemometri används för att lösa både deskriptiva och prediktiva problem inom experimentell naturvetenskap, särskilt inom kemi. I beskrivande tillämpningar modelleras egenskaper hos kemiska system med avsikten att lära sig de underliggande sambanden och strukturen hos systemet, det vill säga modellförståelse och identifiering. I prediktiva tillämpningar modelleras egenskaper hos kemiska system med avsikten att förutsäga nya egenskaper eller beteende av intresse. I båda fallen kan datamängderna vara små men är ofta stora och komplexa och involverar hundratals till tusentals variabler och hundratals till tusentals fall eller observationer.

Kemometriska tekniker används särskilt flitigt inom analytisk kemi och metabolomik och utvecklingen av förbättrade kemometriska analysmetoder fortsätter också att främja det senaste inom analytisk instrumentering och metodik. Det är en tillämpningsdriven disciplin och även om de vanliga kemometriska metoderna används mycket industriellt, är akademiska grupper engagerade i den fortsatta utvecklingen av kemometrisk teori, metod och applikationsutveckling.

Ursprung

Även om man skulle kunna hävda att även de tidigaste analytiska experimenten inom kemi involverade en form av kemometri, är området allmänt erkänt för att ha uppstått på 1970-talet när datorer blev alltmer utnyttjade för vetenskaplig undersökning. Termen "kemometri" myntades av Svante Wold i en anslagsansökan 1971,[2] och International Chemometrics Society bildades kort därefter av Svante Wold och Bruce Kowalski, två pionjärer inom området. Wold var professor i organisk kemi vid Umeå universitet, Sverige, och Kowalski var professor i analytisk kemi vid University of Washington, Seattle.[3]

Många tidiga tillämpningar involverade multivariat klassificering, åtskilliga kvantitativa prediktiva tillämpningar följde, och i slutet av 1970-talet och början av 1980-talet förekom en mängd olika data- och datordrivna kemiska analyser.

Multivariat analys var en kritisk aspekt även i de tidigaste tillämpningarna av kemometri. Data från infraröd och UV/synlig spektroskopi räknas ofta i tusentals mätningar per prov. Masspektrometri, kärnmagnetisk resonans, atomemission/absorption och kromatografiexperiment är också till sin natur mycket multivariata. Strukturen av dessa data visade sig vara gynnsam för att använda tekniker som principalkomponentanalys (PCA), partiella minsta kvadrater (PLS), ortogonala partiella minsta kvadrater (OPLS) och tvåvägs ortogonala partiella minsta kvadrater (O2PLS).[4] Detta beror främst på att, även om datamängderna kan vara mycket multivariata, finns det en stark och ofta linjär struktur med låg rangordning. PCA och PLS har över tid visat sig vara mycket effektiva för att empiriskt modellera den mer kemiskt intressanta lågrankade strukturen, utnyttja de inbördes sambanden eller "latenta variabler" i data, och tillhandahålla alternativa kompakta koordinatsystem för ytterligare numerisk analys som regression, klustring, och mönsterigenkänning. Särskilt partiella minsta kvadrater användes flitigt i kemometriska tillämpningar under många år innan det började hitta regelbunden användning inom andra områden.

Till och med 1980-talet dök tre dedikerade tidskrifter upp inom området: Journal of ChemometricsChemometrics and Intelligent Laboratory Systems och Journal of Chemical Information and Modeling. Dessa tidskrifter fortsätter att täcka både grundläggande och metodologisk forskning inom kemometri. För närvarande publiceras de flesta rutintillämpningar av befintliga kemometriska metoder vanligtvis i tillämpningsorienterade tidskrifter (till exempel Applied SpectroscopyAnalytical ChemistryAnalytica Chimica ActaTalanta). Flera viktiga böcker/monografier om kemometri publicerades också först på 1980-talet, som den första upplagan av Malinowskis Factor Analysis in Chemistry,[5] Sharaf, Illman och Kowalski's Chemometrics,[6] Massart et al. Chemometrics: a textbook,[7] och Multivariate Calibration av Martens och Naes.[8] Vissa stora kemometriska tillämpningsområden har fortsatt att representera nya domäner, såsom molekylär modellering och QSAR, keminformatik, "-omics"-områdena genomik, proteomik, metabonomik och metabolomik, processmodellering och processanalytisk teknologi.

En redogörelse för kemometrins tidiga historia publicerades som en serie intervjuer av Geladi och Esbensen.[9][10]

Tekniker

Multivariat kalibrering

Många kemiska problem och tillämpningar av kemometri involverar kalibrering. Målet är att utveckla modeller som kan användas för att förutsäga egenskaper av intresse baserat på uppmätta egenskaper hos det kemiska systemet, som tryck, flöde, temperatur, infraröda Raman NMR-spektra och masspektra.[11] Exempel är utvecklingen av multivariata modeller som relaterar 1) spektralt svar med flera våglängder på analytkoncentration, 2) molekylära deskriptorer till biologisk aktivitet, 3) multivariata processförhållanden/tillstånd till slutproduktens attribut. Processen kräver en kalibrerings- eller träningsdatauppsättning, som ger referensvärden för egenskaperna av intresse för förutsägelse, och de uppmätta attributen som tros motsvara dessa egenskaper.   Tekniker i multivariat kalibrering kategoriseras ofta brett som klassiska eller omvända metoder.[8][12] Den huvudsakliga skillnaden mellan dessa tillvägagångssätt är att i klassisk kalibrering löses modellerna så att de är optimala för att beskriva de uppmätta analytiska svaren (till exempel spektra) och kan därför anses vara optimala deskriptorer, medan de i omvända metoder modeller löses för att vara optimala för att förutsäga egenskaperna av intresse (till exempel koncentrationer, optimala prediktorer).[13] Omvända metoder kräver vanligtvis mindre fysikalisk kunskap om det kemiska systemet och ger åtminstone i teorin överlägsna förutsägelser i medelkvadratfelsavseende[14][15][16] och därför tenderar omvända tillvägagångssätt att användas oftare i modern multivariat kalibrering.

Klassificering, mönsterigenkänning, klustring

Övervakad multivariat klassificeringsteknik är nära besläktad med multivariat kalibreringsteknik genom att en kalibrerings- eller träningsuppsättning används för att utveckla en matematisk modell som kan klassificera framtida prover. Teknikerna som används inom kemometri liknar de som används inom andra områden – multivariat diskriminantanalys, logistisk regression, neurala nätverk, regression/klassificeringsträd. Användningen av rangreduktionstekniker i samband med dessa konventionella klassificeringsmetoder är rutin i kemometri, till exempel diskriminantanalys på huvudkomponenter eller partiella minsta kvadratpoäng.

En familj av tekniker, kallad klassmodellering eller enklassklassificerare, kan bygga modeller för en enskild klass av intresse.[17] Sådana metoder är särskilt användbara vid kvalitetskontroll och äkthetskontroll av produkter.

Oövervakad klassificering (även kallad klusteranalys) används också ofta för att upptäcka mönster i komplexa datamängder och återigen är många av kärnteknikerna som används inom kemometri gemensamma för andra områden som maskininlärning och statistisk inlärning.

Multivariat kurvupplösning

I kemometriskt språkbruk försöker multivariat kurvupplösning att dekonstruera datamängder med begränsad eller frånvarande referensinformation och systemkunskap. Några av de tidigaste arbetet med dessa tekniker gjordes av Lawton och Sylvestre i början av 1970-talet.[18][19] Dessa tillvägagångssätt kallas också självmodellerande blandningsanalys, blindkälla/signalseparation och spektral avblandning. Till exempel, från en datauppsättning som omfattar fluorescensspektra från en serie prover som vart och ett innehåller flera fluoroforer, kan multivariata kurvupplösningsmetoder användas för att extrahera fluorescensspektra för de individuella fluoroforerna, tillsammans med deras relativa koncentrationer i vart och ett av proverna. Problemet är vanligtvis dåligt avgränsat på grund av otydlighet i rotationsriktningen (många möjliga lösningar kan på motsvarande sätt representera uppmätta data), varför tillämpningen av ytterligare begränsningar är vanligt, såsom icke-negativitet, unimodalitet eller kända inbördes samband mellan de individuella komponenterna (till exempel kinetiska eller massbalansbegränsningar).[20][21]

Se även

Referenser

Den här artikeln är helt eller delvis baserad på material från engelskspråkiga Wikipedia, Chemometrics, 16 maj 2024.

Noter

  1. ^ ”Att analysera flera variabler samtidigt - En introduktion till multivariata metoder (Miljöstatistik.se)”. http://www.miljostatistik.se/multivariat.html. Läst 25 maj 2016. 
  2. ^ As recounted in Wold, S. (1995). ”Chemometrics; what do we mean with it, and what do we want from it?”. Chemometrics and Intelligent Laboratory Systems 30 (1): sid. 109–115. doi:10.1016/0169-7439(95)00042-9. 
  3. ^ Kowalski, Bruce R. (1975). ”Chemometrics: Views and Propositions”. J. Chem. Inf. Comput. Sci. 15 (4): sid. 201–203. doi:10.1021/ci60004a002. 
  4. ^ Trygg, J.; Wold, S. (2003). ”O2-PLS, a two-block (X–Y) latent variable regression (LVR) method with an integral OSC filter” (på engelska). Journal of Chemometrics 17: sid. 53–64. doi:10.1002/cem.775. https://analyticalsciencejournals.onlinelibrary.wiley.com/doi/10.1002/cem.775. 
  5. ^ Malinowski, E. R.; Howery, D. G. (1980). Factor Analysis in Chemistry. New York: Wiley. ISBN 978-0471058816.  (other editions followed in 1989, 1991 and 2002).
  6. ^ Sharaf, M. A.; Illman, D. L.; Kowalski, B. R., reds (1986). Chemometrics. New York: Wiley. ISBN 978-0471831068. 
  7. ^ Massart, D. L.; Vandeginste, B. G. M.; Deming, S. M.; Michotte, Y.; Kaufman, L. (1988). Chemometrics: a textbook. Amsterdam: Elsevier. ISBN 978-0444426604. 
  8. ^ [a b] Martens, H.; Naes, T. (1989). Multivariate Calibration. New York: Wiley. ISBN 978-0471909798. 
  9. ^ Geladi, P.; Esbensen, K. (2005). ”The Start and Early History of Chemometrics: Selected Interviews. Part 1”. J. Chemometrics 4 (5): sid. 337–354. doi:10.1002/cem.1180040503. 
  10. ^ Esbensen, K.; Geladi, P. (2005). ”The Start and Early History of Chemometrics: Selected Interviews. Part 2”. J. Chemometrics 4 (6): sid. 389–412. doi:10.1002/cem.1180040604. 
  11. ^ Barton, Bastian; Thomson, James; Lozano Diz, Enrique; Portela, Raquel (September 2022). ”Chemometrics for Raman Spectroscopy Harmonization” (på engelska). Applied Spectroscopy 76 (9): sid. 1021–1041. doi:10.1177/00037028221094070. ISSN 0003-7028. PMID 35622984. Bibcode2022ApSpe..76.1021B. http://journals.sagepub.com/doi/10.1177/00037028221094070. 
  12. ^ Franke, J. (2002). ”Inverse Least Squares and Classical Least Squares Methods for Quantitative Vibrational Spectroscopy”. i Chalmers, John M. Handbook of Vibrational Spectroscopy. New York: Wiley. doi:10.1002/0470027320.s4603. ISBN 978-0471988472. 
  13. ^ Brown, C. D. (2004). ”Discordance between Net Analyte Signal Theory and Practical Multivariate Calibration”. Analytical Chemistry 76 (15): sid. 4364–4373. doi:10.1021/ac049953w. PMID 15283574. 
  14. ^ Krutchkoff, R. G. (1969). ”Classical and inverse regression methods of calibration in extrapolation”. Technometrics 11 (3): sid. 11–15. doi:10.1080/00401706.1969.10490714. 
  15. ^ Hunter, W. G. (1984). ”Statistics and chemistry, and the linear calibration problem”. i Kowalski, B. R.. Chemometrics: mathematics and statistics in chemistry. Boston: Riedel. ISBN 978-9027718464. 
  16. ^ Tellinghuisen, J. (2000). ”Inverse vs. classical calibration for small data sets”. Fresenius' J. Anal. Chem. 368 (6): sid. 585–588. doi:10.1007/s002160000556. PMID 11228707. 
  17. ^ Oliveri, Paolo (2017). ”Class-modelling in food analytical chemistry: Development, sampling, optimisation and validation issues – A tutorial” (på engelska). Analytica Chimica Acta 982: sid. 9–19. doi:10.1016/j.aca.2017.05.013. PMID 28734370. Bibcode2017AcAC..982....9O. 
  18. ^ Lawton, W. H.; Sylvestre, E. A. (1971). ”Self Modeling Curve Resolution”. Technometrics 13 (3): sid. 617–633. doi:10.1080/00401706.1971.10488823. 
  19. ^ Sylvestre, E. A.; Lawton, W. H.; Maggio, M. S. (1974). ”Curve Resolution Using a Postulated Chemical Reaction”. Technometrics 16 (3): sid. 353–368. doi:10.1080/00401706.1974.10489204. 
  20. ^ de Juan, A.; Tauler, R. (2003). ”Chemometrics Applied to Unravel Multicomponent Processes and Mixtures. Revisiting Latest Trends in Multivariate Resolution”. Analytica Chimica Acta 500 (1–2): sid. 195–210. doi:10.1016/S0003-2670(03)00724-4. Bibcode2003AcAC..500..195D. 
  21. ^ de Juan, A.; Tauler, R. (2006). ”Multivariate Curve Resolution (MCR) from 2000: Progress in Concepts and Applications”. Critical Reviews in Analytical Chemistry 36 (3–4): sid. 163–176. doi:10.1080/10408340600970005. 

Vidare läsning

  • Beebe, K. R.; Pell, R. J.; Seasholtz, M. B. (1998). Chemometrics: A Practical Guide. Wiley. 
  • Brereton, R. G. (2007). Applied Chemometrics for Scientists. Wiley. 
  • Brown, S. D.; Tauler, R.; Walczak, B., reds (2009). Comprehensive Chemometrics: Chemical and Biochemical Data Analysis. 4 volume set. Elsevier. 
  • Gemperline, P. J., red (2006). Practical Guide to Chemometrics (2nd). CRC Press. 
  • Kramer, R. (1998). Chemometric Techniques for Quantitative Analysis. CRC Press. 
  • Maeder, M.; Neuhold, Y.-M. (2007). Practical Data Analysis in Chemistry. Elsevier. 
  • Mark, H.; Workman, J. (2007). Chemometrics in Spectroscopy. Academic Press-Elsevier. 
  • Martens, H.; Naes, T. (1989). Multivariate Calibration. Wiley. 
  • Massart, D. L.; Vandeginste, B. G. M.; Deming, S. M.; Michotte, Y.; Kaufman, L. (1988). Chemometrics: A Textbook. Elsevier. 
  • Otto, M. (2007). Chemometrics: Statistics and Computer Application in Analytical Chemistry (2nd). Wiley-VCH. 
  • Vandeginste, B. G. M.; Massart, D. L.; Buydens, L. M. C.; De Jong, S.; Lewi, P. J.; Smeyers-Verbeke, J. (1998). Hand book of Chemometrics and Qualimetrics: Part A & Part B. Elsevier. 

Externa länkar