Kvantitatiivinen kielitiede
Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 25. maaliskuuta 2018 tarkistetusta
versiosta . tarkastukset vaativat
12 muokkausta .
Kvantitatiivinen kielitiede ( eng. quantitative linguistics ) on osa yleistä kielitiedettä ja erityisesti matemaattista lingvistiikkaa . Kvantitatiivinen lingvistiikka (QL) tutkii kieltä tilastollisilla menetelmillä ; sen perimmäisenä tavoitteena on muotoilla lait, joiden mukaan kieli toimii, ja viime kädessä rakentaa yleinen kieliteoria joukon toisiinsa liittyviä kielten toiminnan lakeja [1] :1-16[ kenen toimesta? ] Synerginen kielitiede . [1] :760-774 Kvantitatiivinen kielitiede perustuu empiirisesti kielitilastojen tuloksiin, jotka puolestaan voidaan tulkita kielten tilastoiksi tai kieliobjektin tilastoiksi. Tämä tietokenttä ei välttämättä liity tieteellisiin perustavoitteisiin. Korpuslingvistiikka ja laskennallinen lingvistiikka edistävät myös kvantitatiivista lingvistiikkaa tarjoamalla tärkeää empiiristä tietoa.
Historia
Varhaisimmat käsitykset KL:stä juontavat juurensa antiikin Kreikan ja muinaisen Intian kulttuureihin. Yksi historiallisista lähteistä sisältää kombinatoriikan sovelluksia kielellisiin todellisuuksiin [2] , toinen perustuu alkeistilastollisiin tutkimuksiin, jotka löytyvät otsikoista kolorimetria ja stichometria . [3]
Kielilait kvantitatiivisessa lingvistiikassa
CL:ssä laki ymmärretään hypoteesien luokkana, joka on johdettu teoreettisista oletuksista, jotka on muotoiltu matemaattisesti, yhdistetty muihin tämän alan lakeihin ja testattu riittävästi ja onnistuneesti empiirisellä tiedolla, eli sellaisia, joita ei voitu kumota lukuisista yrityksistä huolimatta. Köhler kirjoittaa KL:n laeista: ”Lisäksi voidaan osoittaa, että nämä kielellisten elementtien ominaisuudet ja niiden väliset suhteet noudattavat universaaleja lakeja, jotka voidaan muotoilla tiukasti matemaattisesti, aivan kuten luonnontieteiden lait. Tässä yhteydessä on pidettävä mielessä, että nämä lait ovat luonteeltaan stokastisia; niitä ei noudateta jokaisessa yksittäistapauksessa (tämä ei olisi tarpeellista ja mahdollista); pikemminkin ne määrittelevät tapahtumien todennäköisyydet tai tutkittavien ilmiöiden määrälliset suhteet. Jokaiselle edellä mainitulle esimerkille on helppo löytää vastakohtia, mutta nämä tapaukset eivät kuitenkaan riko vastaavia lakeja, koska vaihtelut tilastollisen keskiarvon ympärillä eivät ole vain sallittuja, vaan jopa välttämättömiä, koska ne itse määräytyvät kvantitatiivisesti täsmällisesti vastaavien lait. Tilanne on sama kuin luonnontieteissä, jotka ovat jo pitkään hylänneet vanhat deterministiset ja kausaaliset (kausaali)käsitykset maailmasta ja korvanneet ne tilastollisilla/todennäköisyysmalleilla” [4] .
Joitakin kielen (kieli)lakeja
On olemassa useita kielilakeja, joista [5] :
- Monimuotoisuuden laki: Jos kielelliset kategoriat (kuten puheosat tai kieliopilliset päätteet) esiintyvät eri muodoissa, voidaan sanoa, että niiden esiintymistiheydet teksteissä ovat tiettyjen lakien ohjaamia.
- Pituuksien (tai yleisemmin monikomponenttisen) jakauman laki. Eri kielellisten yksiköiden frekvenssien ja pituuksien tutkiminen teksteissä ja sanakirjoissa johtaa säännöllisesti useiden jakaumien tunnistamiseen tutkittavasta yksiköstä riippuen. Tähän mennessä on tutkittu seuraavia yksiköitä:
- Morfien pituuksien jakautumislaki;
- Rytmisten yksiköiden pituuksien jakautumislaki [6] ;
- lauseen pituuden jakautumislaki;
- Tavupituuksien jakautumislaki;
- Sananpituuden jakautumislaki [7] [8] ;
Muita kielellisiä yksiköitä, jotka myös noudattavat tätä lakia, ovat esimerkiksi kirjaimet (symbolit), joiden monimutkaisuus vaihtelee, ns. hrebit ja puheaktiot. Sama pätee eripituisten (pituusaste) äänten (taustan) jakaumiin.
- Martinin laki: Tämä laki koskee leksikaalisia ketjuja, jotka muodostuvat etsiessään sanakirjasta sanojen määritelmiä (määritelmiä), sitten vasta löydettyjen määritelmien määritelmiä jne. Lopulta kaikki nämä määritelmät muodostavat hierarkian yhä yleisemmistä merkityksistä, kun määritelmät pienenevät, sitä yleisempi arvo saadaan. Tämän hierarkian tasojen joukossa on useita suhteita, jotka noudattavat lakia.
- Menzerathin laki (myös, varsinkin kielitieteessä, Menzerath-Altmannin laki): Tämä laki sanoo, että rakenteen ainesosien mitat pienenevät, kun itse rakenne kasvaa. Mitä pidempi esimerkiksi lause (mitataan sen osalauseiden lukumäärällä), sitä lyhyemmät sen osalauseet (mitataan sanojen lukumäärällä) tai: mitä pidempi sana (tavuina tai morfeina), sitä lyhyemmät tavut ovat tai niiden äänet.
- Taajuusluokkajakauman lait: Lähes mikä tahansa kieliyksikkö noudattaa näitä lakeja. Tässä on vain muutama esimerkki:
- Tekstin sanat on järjestetty niiden esiintymistiheyden mukaan tekstissä, ja jokaiselle niistä on määritetty järjestysnumero ja vastaava taajuus. George Kingsley Zipfin (ja hänen kuuluisan lakinsa) ajoista lähtien on ehdotettu lukuisia matemaattisia malleja kuvaamaan arvon ja taajuuden välistä suhdetta.
- Samanlainen jakautuminen voidaan havaita äänten, foneemien ja kirjainten järjestyksen ja taajuuden välillä.
- Sanassosiaatiot: Assosiaatioiden järjestys ja tiheys vastaavat (sanalliseen) ärsykkeeseen.
- Kielen muutoksen laki: kielen kasvuprosessit (kuten sanaston laajeneminen), vieraiden ja lainattujen sanojen leviäminen, muutokset taivutusjärjestelmässä - noudata KL:ssä Piotrovskyn lakia tunnettua lakia ja vastaa kasvumalleja muut tieteenalat. Piotrovskyn laki on ns. logistisen mallin erikoistapaus (vrt. logistinen yhtälö ). Sen on osoitettu vaikuttavan myös kielenhankinnan prosesseihin (vrt. kielen hankinnan laki).
- Tekstilohkolaki: Kielelliset yksiköt (esim. sanat, kirjaimet, syntaktiset funktiot ja konstruktit) näyttävät tietyt taajuusjakaumat yhtä suurissa tekstilohkoissa.
- Zipfin laki : sanan taajuus on kääntäen verrannollinen sen sarjanumeroon taajuusluetteloissa [9] .
Tyylit
Runollisten ja ei-runollisten tyylien tutkiminen voi perustua tilastollisiin menetelmiin; Lisäksi on mahdollista tehdä asianmukaista tutkimusta erityyppisissä teksteissä kielilakien omien erityismuotojen (parametrien) perusteella. Tällaisissa tapauksissa CL tekee stilistista tutkimusta: yksi lopullisista tavoitteista on todistaa tyyliilmiön olemassaolo viittaamalla kielilain toimintaan (ja mahdollisimman objektiivisesti. Yksi CL:n pääoletuksista on, että jotkut lait (esim. sananpituuksien lakijakaumat) edellyttävät erilaisia malleja, ainakin lain parametrien (jakaumien tai funktioiden) eri arvoja tekstin tyypistä riippuen. Jos tutkitaan runotekstejä, niin CL-menetelmät muodostavat alatieteen nimeltä "Kvantitatiivinen kirjallisuuden tutkimus" ( Stylometria ) [10] .
Muistiinpanot
- ↑ 1 2 Reinhard Köhler. Gegenstand und Arbeitsweise der Quantitativen Linguistik // Kvantitatiivinen kielitiede / Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.). — Berliini/New York: Ein internationales Handbuch. de Gruyter, 2005. - ISBN 3-11-015578-8 .
- ↑ NL Biggs: The Roots of Combinatorics. Julkaisussa: Historia Mathematica 6, 1979, s. 109-136.
- ↑ Adam Pawłowski: Prolegomena korpuksen ja kvantitatiivisen kielitieteen historiaan. Kreikan antiikin. Julkaisussa: Glottotheory 1, 2008, s. 48-54.
- ↑ vrt. huomautus 1, s. 1-2.
- ↑ vrt. viitteet: Köhler, Altmann, Piotrowski (toim.) (2005)
- ↑ Marina Knaus: Zur Verteilung rhythmischer Einheiten in russischer Prosa. Julkaisussa: Glottometrics 16, 2008, s. 57-62. (PDF ram-verlag.eu Arkistoitu 11. kesäkuuta 2020 Wayback Machinessa )
- ↑ Ioan-Iovitz Popescu, et aii: Sanan pituus: näkökohdat ja kielet. Julkaisussa: Reinhard Köhler, Gabriel Altmann (toim.): Issues in Quantitative Linguistics 3. Omistettu Karl-Heinz Bestille hänen 70-vuotissyntymäpäivänsä johdosta . Ludenscheid: RAM-Verlag 2013, s. 224-281. ISBN 978-3-942303-12-5 .
- ↑ Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Unified Modeling of Length in Language. Lüdenscheid: RAM-Verlag 2014. ISBN 978-3-942303-26-2 .
- ↑ H. Guiter, MV Arapov (toim.): Studies on Zipf's Law. Bochum: Brockmeyer 1982. ISBN 3-88339-244-8 .
- ↑ Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme . Julkaisussa: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berliini/New York 2005, s. 325-348, esim. Quantitative Style , s. 339-340. ISBN 3-11-015578-8 ; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, ISBN 978-3-9802659-5-9 .
Kirjallisuus
- Karl-Heinz Paras : Kvantitatiivinen kielitiede. Eine Annaherung . 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4 .
- Karl-Heinz Best, Otto Rottmann: Kvantitatiivinen kielitiede, kutsu. RAM-Verlag, Lüdenscheid 2017. ISBN 978-3-942303-51-4 .
- Peter Grzybek, Emmerich Kelih: Zur Vorgeschichte quantitativer Ansätze in der russischen Sprach- und Literaturwissenschaft . Julkaisussa: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (toim.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch – kansainvälinen käsikirja. de Gruyter, Berliini/New York 2005, s. 23-64. ISBN 3-11-015578-8 .
- Emmerich Kelih: Geschichte der Anwendung quantitative Verfahren in der russischen Sprach- und Literaturwissenschaft. Kovač, Hampuri 2008. ISBN 978-3-8300-3575-6 .
- Sebastian Kempgen Systematischer Oberblick und Bibliographie. Verlag Otto Sagner, München 1995. ISBN 3-87690-617-2 .
- VV Levitsky: Kvantitatiiviset menetelmät kielitieteessä. Uusi kirja, Vinnitsa 2007. ISBN 978-966-382-046-0 .
- AV Zenkov, Method of Text Attribution Based on the Statistics of Numerals // Journal of Quantitative Linguistics. 2018 Voi. 25, nro 3, s. 256-270. DOI: 10.1080/09296174.2017.1371915.
Sanakirjat ja tietosanakirjat |
|
---|
Bibliografisissa luetteloissa |
|
---|