Veden autoionisaation paikalliset käynnistymisolosuhteet

Tulokset ja keskustelu

Autoionisaatiotapahtumaa tutkittiin ab initio RETIS-simuloinneilla, jotka on kuvattu kohdassa Materiaalit ja menetelmät. RETIS-simuloinneissa käytimme suhteellisen yksinkertaista geometrista etäisyysjärjestysparametria λ, kuten kuvassa 1 on esitetty: Kun systeemi koostuu vain H2O-lajeista, λ on suurin kovalenttisen O-H-sidoksen etäisyys, ja kun systeemi sisältää OH- ja H3O+ -lajeja, λ:ksi katsotaan lyhin etäisyys OH-:n hapen ja H3O+:n vetyatomien välillä. Seuraavassa viittaamme järjestysparametrina käytettyyn happiatomiin nimellä Oλ. Lajityyppi (OH-, H2O tai H3O+) tunnistettiin osoittamalla kullekin vedylle yksittäinen sidos, joka yhdistää sen lähimpään happeen. Huomattakoon, että järjestysparametrin määrittely ei edellytä kynnysarvoa kemiallisen sidoksen määrittelylle eikä se sido järjestysparametria tiettyihin vesimolekyyleihin simulaation ajaksi. Tämä tarkoittaa, että laskemme systeemin minkä tahansa vesimolekyylin dissosioitumisnopeuden yksittäisen kohdennetun O-H-sidoksen tai vesimolekyylin sijasta.

Kuva 4. Ennustuskyky TAλc,λr.

Aloitusehdot ja paikalliset kollektiiviset muuttujat. (A) Reaktiiviset (rλc,λr(ξ)) ja ei-reaktiiviset (uλc,λr(ξ)) jakaumat, kun ξ={w4,na} ja λc=1.16 Å ja λr=2.0 Å. Havainnollistamisen vuoksi kuvatut jakaumat on normalisoitu . Ylä- ja oikeanpuoleiset insertit osoittavat jakaumien yksiulotteiset projektiot. Kahden jakauman selvä erottelu on nähtävissä w4-koordinaattia pitkin, mikä osoittaa, että reaktiiviset liikeradat ovat puristuneempia kuin ei-reaktiiviset liikeradat. Lisäksi järjestysparametrin laskennassa käytetty happiatomi (Oλ) hyväksyy keskimäärin suuremman määrän vetysidoksia reaktiivisissa liikeratoissa verrattuna ei-reaktiivisiin liikeratoihin. (B) Havainnollistava tilannekuva reaktiivisesta liikeradasta, jossa Oλ on esitetty sinisellä. Neljä ympäröivää happiatomia, joita käytetään tetraedrisen järjestysparametrin q laskennassa, on esitetty oranssilla. Vesijohto on korostettu keltaisella viivalla (ja harmailla läpinäkyvillä palloilla) ja kulmaparametri qcos on merkitty. Tässä tilannekuvassa vesilanka on kokoonpuristunut, q osoittaa poikkeamaa tetraedrirakenteesta, qcos osoittaa, että kolme happiatomia on rivissä langassa, ja Oλ ottaa vastaan kolme vetysidosta ja luovuttaa yhden (esitetty vihreillä viivoilla).

Jos tarkastelemme q-koordinaattia, havaitsemme, että rλc,λr on siirtynyt kohti pienempiä q-arvoja verrattuna uλc,λr:ään, mikä osoittaa, että tapahtuman voi käynnistää myös vääristymä tetraedrisestä järjestelystä dissosioituvan vesilajin ympärillä. Tämä havainto on hieman yllättävä, sillä joissakin muissa vesifaasissa tapahtuvissa kemiallisissa reaktioissa on havaittu päinvastainen vaikutus (31). Samanlaisia johtopäätöksiä voidaan tehdä ξ=(w4,qcos) -jakaumasta. Tässä on piikki qcos-koordinaatin varrella reaktiiviselle jakaumalle, joka on lähempänä vesimolekyylien lineaarista järjestelyä. Kuvassa 4B on edustava tilannekuva, joka on saatu reaktiivisen radan alkuvaiheessa (3 fs:n jälkeen). Kaiken kaikkiaan kuvassa 3 esitetyt tulokset kertovat, että vesijohdon kokoonpuristuminen (mitattuna w4:llä) ja hyperkoordinaatio (mitattuna na:lla) tai vääristyminen (mitattuna q:lla ja qcos:lla) ovat välttämättömiä aloitusehtoja autoionisaatiolle. Nämä eivät kuitenkaan ole riittäviä edellytyksiä, kuten TAλc,λr:n arvot kuvassa 3B osoittavat: edelleen 60 % ihanteellisella ξ-parametrin alueella alkavista trajektoreista ei onnistu saamaan aikaan koordinoitua protonihyppyä.

Koneellinen oppiminen (ML), jota sovelletaan polkujen näytteenottotietoihin (33, 34), on lupaava lähestymistapa tärkeiden kollektiivisten muuttujien löytämiseksi, jotka jäävät helposti huomaamatta inhimillisellä intuitiolla. Tutkiaksemme tätä mahdollisuutta rakensimme ML-malleja, joilla ennustetaan liikeratojen lopputulosta, kun otetaan huomioon vesijärjestelmän tila liikeratojen alkuvaiheessa. Keskitymme samaan alueeseen kuin ennustusvoima-analyysissä ja käytämme lopputuloksen ennustamiseen järjestelmän tilaa, kun λ>1,15 Å saavutetaan ensimmäisen kerran. Käytimme useita ML-tekniikoita, joissa jokainen pariton polkukokonaisuus otettiin mukaan kalibrointiin ja parillisia polkukokonaisuuksia käytettiin testijoukkoon. Vaihtoehtoinen jako, jossa kunkin polkukokonaisuuden tiedot jaettiin tasan kahtia, antoi samanlaisia tuloksia. Koska voimakkaasti vinoja jakaumia on vaikea käsitellä ML:n avulla, jätimme lisäksi pois tietokokonaisuuksien uudelleenpainotuksen vastaavien polkuyhdistelmien tilastollisilla painoilla. Sovelsimme kuitenkin ML-tekniikoita kvalitatiivisena lähestymistapana löytääksemme uusia parametreja, joita voitiin testata kvantitatiivisesti ennustusvoimamenetelmässä (19).

Välttääksemme mahdollisen ylitulkintariskin päätimme lisäksi rajoittaa ML-päätösprosessin monimutkaisuutta ja asetimme TAλc,λr:n laskennassa maksimissaan neljä järjestysparametria. Esimerkiksi ensemble-pohjaisilla gradient-boosting-koneilla (35, 36) saatiin erinomaisia ennustuskykyjä (>90 %). Mallin tulkinta on kuitenkin ongelmallista, koska käytetään 100-150 syvän päätöspuun muodostamaa kokonaisuutta (jotka lisätään peräkkäin). Vaikka suorituskyky paranee, sattumanvaraisten korrelaatioiden aiheuttaman ylisovittamisen mahdollisuus kasvaa. Siksi olemme rajoittuneet luokittelu- ja regressiopäätöspuihin (CART) perustuviin yhden puun päätösmalleihin (20). TAλc,λr-funktion rajoittaminen neljään järjestysparametriin perustuu samanlaisiin syihin. Useampien parametrien lisääminen johtaa harvempiin matriiseihin, jotka edustavat reaktiivisia/ei-reaktiivisia jakaumia, ja tämän seurauksena numeerinen integrointi näiden jakaumien päällekkäisyyden laskemiseksi on hyvin herkkä binäärikoolle ja saattaa aliarvioida päällekkäisyyttä, koska binäärit ovat tyhjiä riittämättömän tilaston vuoksi.

Harkitsimme 138 kollektiivista muuttujaa, jotka koostuivat hapen ja hapen etäisyyksistä; hapen ja vedyn etäisyyksistä alun perin sitoutuneille vesimolekyyleille; kaikista Oλ:n ja sen neljän lähimmän happinaapurin muodostamista kulmista; ja Steinhardtin järjestysparametreista järjestysasteissa 3, 4 ja 6 (32) (ks. tarkemmat tiedot kohdasta Materiaalit ja menetelmät). Lisäksi lisättiin jo huomioon otetut järjestysparametrit. Kuvassa 5A esitetään tuloksena saatu päätöspuu. Huomionarvoista on, että kaikista syöttöparametreista w4-parametri on sekä päätöspuun kärjessä että tärkein muuttuja mitattuna kunkin muuttujan luokitteluvirheen vähenemisellä päätöspuun jokaisessa jaossa (20) (SI-liite, kuva S9). Myös tetraedrijärjestys ja hyväksyttyjen vetysidosten määrä näkyvät päätöspuussa. Ensimmäisen vaikutuksen kuvaamiseksi ML-lähestymistapa priorisoi Steinhardtin q4-järjestysparametrin aiemmin käyttämämme vastaavan q-parametrin edelle. Jotkin etäisyydet, jotka myös näkyvät päätöspuussa, kuten d25, Oλ:n ja sen 25. lähimmän hapen välinen etäisyys, johtuvat todennäköisesti satunnaisista korrelaatioista, jotka johtuvat aineiston rajallisesta koosta. Tämä voidaan varmistaa tarkastelemalla tämän muuttujan tärkeyttä: d25 ei esiinny 20 tärkeimmän muuttujan joukossa (SI-liite, kuva S9), ja itse asiassa muut samankaltaiset muuttujat (esim. d24) sijoittuvat korkeammalle sijalle, vaikkakin alhaisella tärkeydellä. Tärkeämpi ja intuitiivisesti järkevämpi parametri, jota ML-lähestymistapa ehdottaa, on λ2, OH-etäisyys lähimmän Oλ-hapen ja sen vedyn, jolla on suurin intramolekulaarinen sidos, välillä. Ennustuskyvyn uudelleenlaskenta ML-puun parametrien avulla (kuva 5B) ei tuottanut parempia tuloksia kuin yhdistelmä w4, q, na ja qcos, mutta sitä olisi pidettävä yhtä hyvänä, kun otetaan huomioon tilastolliset epävarmuustekijät.

kuva 5.

Koneoppimisanalyysin tulokset. (A) Luokittelu- ja regressiopuu aloitettujen liikeratojen lopputuloksen ennustamiseksi. Tässä otimme huomioon useita kollektiivisia lisämuuttujia (kuvaus kohdassa Materiaalit ja menetelmät), mutta puun rakentamiseen tarvitaan lopulta vain pieni osajoukko: w4, q4 , λ2 (Oλ-lajia lähimpänä olevan vesimolekyylin venytetyn vetysidoksen pituus), di (etäisyys Oλ:stä i:nneksi lähimpään happeen) ja d¯i (keskimääräinen etäisyys, kun otetaan huomioon i:nneksi lähimpänä olevaa happea). Solmujen merkintätavat on selitetty vasemmassa yläkulmassa olevalla itsenäisellä solmulla. Tämä puu ennustaa trajektorien olevan reaktiivisia, eli saavuttavan λ≥2, tai ei-reaktiivisia perustuen kollektiivisiin muuttujiin, jotka on saatu trajektorien siinä kehyksessä, jossa λ on ensin ≥1,15. Reaktiivisia ratoja ennustavat solmut on väritetty sinisellä (luokka 1), kun taas ei-reaktiivisia ratoja ennustavat solmut on väritetty vihreällä (luokka 0). Huomaa, että neliöiden alaosassa olevat prosenttiosuudet eivät heijasta fysikaalisesti oikeita osuuksia, koska polkukokonaisuuksia ei painotettu uudelleen niiden tilastollisten painojen avulla. Säännöt ovat tekstimuotoisia esityksiä puun kulkemisesta; esimerkiksi sääntö 5 (joka ennustaa reaktiivisia ratoja) voidaan ilmaista muodossa w4≥7,6 ja λ2≥1,1. Nämä säännöt antavat erilaisia aloitusedellytyksiä, ja ne on lueteltu SI-liitteen taulukossa S1 alimman solmurivin osalta. (B) Ennustusvoima ja ylitystodennäköisyys λr:n funktiona λc=1,16 Å:lle ja erilaisille kollektiivisten muuttujien yhdistelmille. Tässä verrataan ennustusvoimaa käyttämällä tunnistamiamme kollektiivisia muuttujia muuttujiin, jotka on merkitty tärkeiksi koneoppimisanalyysissä. (C) Reaktiiviset (rλc,λr(ξ)) ja ei-reaktiiviset (uλc,λr(ξ)) jakaumat, kun ξ={λ2,d¯2} ja λc=1,16 Å ja λr=2,0 Å. Visualisoinnin vuoksi kuvatut jakaumat on normalisoitu. Ylä- ja oikeanpuoleiset insertit osoittavat jakaumien yksiulotteiset projektiot.

Vastaa

Sähköpostiosoitettasi ei julkaista.