Kvantitatiivinen kielitiede

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 25. maaliskuuta 2018 tarkistetusta versiosta . tarkastukset vaativat 12 muokkausta .

Kvantitatiivinen kielitiede ( eng.  quantitative linguistics ) on osa yleistä kielitiedettä ja erityisesti matemaattista lingvistiikkaa . Kvantitatiivinen lingvistiikka (QL) tutkii kieltä tilastollisilla menetelmillä ; sen perimmäisenä tavoitteena on muotoilla lait, joiden mukaan kieli toimii, ja viime kädessä rakentaa yleinen kieliteoria joukon toisiinsa liittyviä kielten toiminnan lakeja [1] :1-16[ kenen toimesta? ] Synerginen kielitiede . [1] :760-774 Kvantitatiivinen kielitiede perustuu empiirisesti kielitilastojen tuloksiin, jotka puolestaan ​​voidaan tulkita kielten tilastoiksi tai kieliobjektin tilastoiksi. Tämä tietokenttä ei välttämättä liity tieteellisiin perustavoitteisiin. Korpuslingvistiikka ja laskennallinen lingvistiikka edistävät myös kvantitatiivista lingvistiikkaa tarjoamalla tärkeää empiiristä tietoa.

Historia

Varhaisimmat käsitykset KL:stä juontavat juurensa antiikin Kreikan ja muinaisen Intian kulttuureihin. Yksi historiallisista lähteistä sisältää kombinatoriikan sovelluksia kielellisiin todellisuuksiin [2] , toinen perustuu alkeistilastollisiin tutkimuksiin, jotka löytyvät otsikoista kolorimetria ja stichometria . [3]

Kielilait kvantitatiivisessa lingvistiikassa

CL:ssä laki ymmärretään hypoteesien luokkana, joka on johdettu teoreettisista oletuksista, jotka on muotoiltu matemaattisesti, yhdistetty muihin tämän alan lakeihin ja testattu riittävästi ja onnistuneesti empiirisellä tiedolla, eli sellaisia, joita ei voitu kumota lukuisista yrityksistä huolimatta. Köhler kirjoittaa KL:n laeista: ”Lisäksi voidaan osoittaa, että nämä kielellisten elementtien ominaisuudet ja niiden väliset suhteet noudattavat universaaleja lakeja, jotka voidaan muotoilla tiukasti matemaattisesti, aivan kuten luonnontieteiden lait. Tässä yhteydessä on pidettävä mielessä, että nämä lait ovat luonteeltaan stokastisia; niitä ei noudateta jokaisessa yksittäistapauksessa (tämä ei olisi tarpeellista ja mahdollista); pikemminkin ne määrittelevät tapahtumien todennäköisyydet tai tutkittavien ilmiöiden määrälliset suhteet. Jokaiselle edellä mainitulle esimerkille on helppo löytää vastakohtia, mutta nämä tapaukset eivät kuitenkaan riko vastaavia lakeja, koska vaihtelut tilastollisen keskiarvon ympärillä eivät ole vain sallittuja, vaan jopa välttämättömiä, koska ne itse määräytyvät kvantitatiivisesti täsmällisesti vastaavien lait. Tilanne on sama kuin luonnontieteissä, jotka ovat jo pitkään hylänneet vanhat deterministiset ja kausaaliset (kausaali)käsitykset maailmasta ja korvanneet ne tilastollisilla/todennäköisyysmalleilla” [4] .

Joitakin kielen (kieli)lakeja

On olemassa useita kielilakeja, joista [5] :

Muita kielellisiä yksiköitä, jotka myös noudattavat tätä lakia, ovat esimerkiksi kirjaimet (symbolit), joiden monimutkaisuus vaihtelee, ns. hrebit ja puheaktiot. Sama pätee eripituisten (pituusaste) äänten (taustan) jakaumiin.

Tyylit

Runollisten ja ei-runollisten tyylien tutkiminen voi perustua tilastollisiin menetelmiin; Lisäksi on mahdollista tehdä asianmukaista tutkimusta erityyppisissä teksteissä kielilakien omien erityismuotojen (parametrien) perusteella. Tällaisissa tapauksissa CL tekee stilistista tutkimusta: yksi lopullisista tavoitteista on todistaa tyyliilmiön olemassaolo viittaamalla kielilain toimintaan (ja mahdollisimman objektiivisesti. Yksi CL:n pääoletuksista on, että jotkut lait (esim. sananpituuksien lakijakaumat) edellyttävät erilaisia ​​malleja, ainakin lain parametrien (jakaumien tai funktioiden) eri arvoja tekstin tyypistä riippuen. Jos tutkitaan runotekstejä, niin CL-menetelmät muodostavat alatieteen nimeltä "Kvantitatiivinen kirjallisuuden tutkimus" ( Stylometria ) [10] .

Muistiinpanot

  1. ↑ 1 2 Reinhard Köhler. Gegenstand und Arbeitsweise der Quantitativen Linguistik // Kvantitatiivinen kielitiede / Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.). — Berliini/New York: Ein internationales Handbuch. de Gruyter, 2005. - ISBN 3-11-015578-8 .
  2. NL Biggs: The Roots of Combinatorics. Julkaisussa: Historia Mathematica 6, 1979, s. 109-136.
  3. Adam Pawłowski: Prolegomena korpuksen ja kvantitatiivisen kielitieteen historiaan. Kreikan antiikin. Julkaisussa: Glottotheory 1, 2008, s. 48-54.
  4. vrt. huomautus 1, s. 1-2.
  5. vrt. viitteet: Köhler, Altmann, Piotrowski (toim.) (2005)
  6. Marina Knaus: Zur Verteilung rhythmischer Einheiten in russischer Prosa. Julkaisussa: Glottometrics 16, 2008, s. 57-62. (PDF ram-verlag.eu Arkistoitu 11. kesäkuuta 2020 Wayback Machinessa )
  7. Ioan-Iovitz Popescu, et aii: Sanan pituus: näkökohdat ja kielet. Julkaisussa: Reinhard Köhler, Gabriel Altmann (toim.): Issues in Quantitative Linguistics 3. Omistettu Karl-Heinz Bestille hänen 70-vuotissyntymäpäivänsä johdosta . Ludenscheid: RAM-Verlag 2013, s. 224-281. ISBN 978-3-942303-12-5 .
  8. Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Unified Modeling of Length in Language. Lüdenscheid: RAM-Verlag 2014. ISBN 978-3-942303-26-2 .
  9. H. Guiter, MV Arapov (toim.): Studies on Zipf's Law. Bochum: Brockmeyer 1982. ISBN 3-88339-244-8 .
  10. Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme . Julkaisussa: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berliini/New York 2005, s. 325-348, esim. Quantitative Style , s. 339-340. ISBN 3-11-015578-8 ; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, ISBN 978-3-9802659-5-9 .

Kirjallisuus