SMILES ( Simplified Molecular Input Line Entry System , englanniksi - "systeemi molekyylien yksinkertaistetuksi esittämiseksi syöttörivillä") on sääntöjärjestelmä (spesifikaatio) kemiallisen molekyylin koostumuksen ja rakenteen yksiselitteiseen kuvaukseen ASCII -koodia käyttäen. merkkijono . Englanninkielinen nimi on homonyymi sanalle hymyilee ( hymyilee ), mutta se kirjoitetaan vain isoilla kirjaimilla. Sillä ei ole yksiselitteistä analogia venäjäksi, on suositeltavaa käyttää sitä alkuperäisellä kielellä. Lausutaan kuin "hymiö".
Monet molekyylieditorit voivat muuntaa SMILESin sääntöjen mukaan kootun merkkijonon molekyylin kaksi- tai kolmiulotteiseksi rakennekaavaksi .
Arthur Weininger ja David Weininger kehittivät alkuperäisen SMILES-spesifikaation 1980-luvun lopulla [1] . Standardia on sittemmin muutettu ja laajennettu; Aktiivisimmin tähän työhön osallistui Daylight Chemical Information Systems, Inc .. .
Muita rivimerkintöjä ovat Wiswesser (WLN), SMARTS , ROSDAL ja Sybyl Line Notation ( Tripos Inc. ). Äskettäin IUPAC ehdotti InChI :tä standardiksi kaavojen lineaariseen esittämiseen. SMILES:llä on etuja InChI:een verrattuna, erityisesti se, että henkilö havaitsee kaavat paremmin, sekä yksinkertaisempi ohjelmistotuki laajan teoreettisen pohjagraafiteorian ansiosta .
Alkuperäisestä SMILES-spesifikaatiosta puuttui sääntöjä, jotka koskivat merkinnän rakentamista ja molekyylien avaruudellisten isomeerien erottamista. Näiden ongelmien ratkaisemiseksi standardiin on kehitetty laajennuksia:
Graafiteorian kannalta SMILES on merkkijono, joka saadaan tulostamalla molekyyligraafin kärkien symbolit niiden syvyys -ensimmäistä läpikulkua vastaavassa järjestyksessä . Graafin alkukäsittely sisältää vetyatomien ja yksinkertaisten sidosten poistamisen sekä syklien hajotuksen siten, että tuloksena oleva graafi on kattava metsä . Paikkoihin, joissa graafi on jaettu, on numerot, jotka osoittavat sidoksen olemassaolon alkuperäisessä molekyylissä. Sulkuja käytetään osoittamaan molekyylin haarapisteet .
Atomit on merkitty kemiallisten alkuaineiden symboleilla hakasulkeissa , esimerkiksi kultaa merkitään [Au]. Organogeenisten alkuaineiden ( B , C , N , O , P , S , F , Cl , Br , I ) sulut voidaan jättää pois. Tässä tapauksessa vetyatomit voidaan jättää eksplisiittisesti pois, jos niiden lukumäärä vastaa pienintä normaalivalenssia eksplisiittisesti määriteltyjen sidosten mukaisesti . Aromaattisten renkaiden atomit kirjoitetaan yleensä pienillä kirjaimilla isojen kirjainten sijasta, vaikka jotkut SMILESin murteet käyttävät nimenomaista kaksois- ja kertasidosten vuorottelua (kuten Kekulen bentseenin rakennekaavassa ). Jos on tarpeen osoittaa hiukkasen muodollinen varaus, vetyatomit ja varaussymboli kirjoitetaan eksplisiittisesti [3] . Isotoopit kirjoitetaan hakasulkeisiin atomipainon atomisymbolin eteen, esimerkiksi 13 C-isotooppi kirjoitetaan muodossa . [13C]
Esimerkiksi veden SMILES-merkintä olisi O, etanolin kohdalla se olisi CCO. Hydroksyylianioni on kirjoitettu ja rauta(II ) -ioni[OH-] muodossa .[Fe+2]
Yksittäinen kemiallinen sidos voidaan kirjoittaa käyttämällä symbolia -sitoutuneiden atomien väliin, mutta käytännössä sitä ei käytetä, väliviivasymboli jätetään pois. Myös aromaattisen sidoksen nimitys ( : ) jätetään yleensä pois. Kaksoissidosta merkitään yhtäläisyysmerkillä , esimerkiksi hiilidioksidi kirjoitetaan muodossa O=C=O. Kolmoissidosta merkitään oktotorpilla , esimerkiksi syaanivetyhappo kirjoitetaan muodossa C#N.
Molekyylin sivuketjut on suljettu suluissa . Esimerkiksi propionihappo kirjoitetaan muodossa CCC(=O)O. Trifluorimetaanin kanoninen muoto näyttää tältä C(F)(F)F, mutta tällaista merkintää on hankala lukea sen ylikuormituksen vuoksi, joten sama molekyyli voidaan kirjoittaa ei-kanoniseen muotoon kuin FC(F)F.
Virittävän metsän rakentamisen aikana katkenneen sidoksen päissä sijaitsevat atomit on merkitty samalla numerolla. Esimerkiksi sykloheksaani kirjoitetaan muodossa C1CCCCC1, ja bentseeni kirjoitetaan muodossa c1ccccc1.
Kaksoissidoskokoonpano kirjoitetaan / ja \ . _ Esimerkiksi vastaa trans - difluorietyleeniä ja tai vastaa cis - difluorieteeniä (katso kuva). F/C=C/FF/C=C\FF\C=C/F
SMARTS on SMILESin muunnos, joka mahdollistaa atomien ja sidosten epäjärjestyneen rakenteen käytön. Käytetään laajasti ainetietokantojen hakukoneissa. Sovelluskäytäntö on aiheuttanut yleisen väärinkäsityksen, että tietokonehaussa rakenteita verrataan ketjutietueita, kun taas SMILES-kaavojen perusteella tehtyjen graafien vertailu tehdään paljon tuottavammin.
SMILES-kaava voidaan muuntaa kaksiulotteiseksi rakennekaavaksi käyttämällä Helsonin kehittämiä Structure Diagram Generation -algoritmeja [4] . Muutos ei aina anna yksiselitteistä tulosta. Muunnos kolmiulotteiseksi rakennekaavaksi suoritetaan käyttämällä aineen muodostumisen minimienergian periaatetta.
Molekyylivisualisointi | |||||
---|---|---|---|---|---|
Kemialliset kaavat |
| ||||
Molekyylimallit |
| ||||
muu |
Rakennekemia | |
---|---|
kemiallinen sidos | |
Rakenteen näyttö | |
Elektroniset ominaisuudet | |
Stereokemia |