Venäjän kielen konerahasto
Venäjän kielen konerahasto on hanke, jolla luodaan laaja venäjän kielen edustava korpus . MFRL:n kokemusta on käytetty vuodesta 2004 lähtien Venäjän kielen kansallisaineiston kehittämisessä .
Ohjelma MFRN:n luomiseksi
Venäjän kielen konerahaston osasto perustettiin vuonna 1985 akateemikko A. P. Ershovin aloitteesta vuonna 1983 pidetyn erityiskokouksen jälkeen. [1] Neuvostoliiton tiedeakatemian kirjeenvaihtajajäsenen Yu.N. tieteellinen tutkimus ja soveltava kehitys venäjän kielen konerahaston perustamisesta vuosille 1996-2000 ja tutkimuksen informatisoinnista.
Venäjän kielen konerahaston luomiseen (1986-1990) osallistui yli 40 yhteistyöorganisaatiota, muun muassa Moskovan , Leningradin , Harkovin , Grodnon , Syktyvkarin ja Saratovin yliopistot.
Venäjän tutkimuksen tieteellisen tutkimuksen ja soveltavan kehityksen monimutkainen informatisointi ymmärrettiin seuraavasti:
- Venäjän kielen instituutin osastojen ja yhteistoimintaorganisaatioiden johdonmukainen varustaminen nykyaikaisilla tietokoneilla, jotta ne voidaan yhdistää paikalliseen verkkoon (ei valmis)
- Johdonmukainen kerääminen konemedialle ja tietokantoihin tärkeimmistä lähteistä, jotka ovat välttämättömiä sekä venäjän kielen tieteelliseen tutkimukseen että sovelletun kehityksen toteuttamiseen (osittain valmis)
- Ohjelmistotyökalujen luominen, joita tarvitaan sekä filologian tieteellisten julkaisujen valmistukseen että soveltavaan tutkimukseen (2 MS-DOS- ohjelmaa on kehitetty ja useita sanakirjoja on muutettu sähköiseen muotoon);
- Akateemisen venäjän tutkimuksen olennaiseksi osaksi sovellettavien alueiden (leksikografia, terminologia, automaattinen tietojenkäsittely luonnollisella kielellä) kehittäminen, jotka toisaalta ovat perustutkimuksen tulosten viejä käytäntöön ja toisaalta uusien ideoiden ja tiedon lähde perustieteeseen (ohjelmaa ei ole toteutettu).
Ohjelman toteutus (1985-1992)
Venäjän kielen konerahaston osasto (osittain mukana toimeenpanijat) on 8 vuoden työnsä ajan suorittanut:
- Venäjän kielen konerahaston konseptin ja arkkitehtuurin kehittäminen [2]
- Terminologisen tietopankin käsitteen kehittäminen [3]
- Merkittävä määrä lähteitä - 1800-1900-luvun venäläisen kirjallisuuden tekstilähteet, venäjän kielen pääsanakirjat, lyhyt akateeminen kielioppi, joitain muita viitemateriaaleja on kertynyt konemedialle ja osittain tietokantoihin, runous, kaunokirjallisuus, yhteiskuntapoliittiset ja tekniset tekstit [4]
- Kahden MS-DOS- ohjelman kehittäminen :
— UNILEX-T taajuussanakirjojen, sanaindeksien (tekstien sanojen indeksien) ja
konkordanssien tekemiseen ja työskentelyyn niiden kanssa
[5]
- UNILEX-D sanakirjatietokantojen luomiseen ja työskentelyyn.
[6]
- Lähdeohjelmistopakettien kehittäminen (niiden kehitys lopetettiin), esim.
Venäjän kielen automaattinen syntaksisanakirja
Automaattinen venäjän synonyymien sanakirja
Automaattinen versio
S. I. Ožegovin venäjän kielen sanakirjasta
Automaattinen verbihallinnan sanakirja venäjäksi.
[7]
Valtiovarainministeriön venäjän kielen osaston toiminta (1992-1998)
UNILEXin kielellisten tietojenkäsittelyjärjestelmien täysimittainen testaus osallistumalla 1900-luvun oikeinkirjoitus- ja runosanakirjan valmisteluun.
Uusien lähteiden nopeutettu kertyminen sanomalehtien sähköisiin painoksiin ja venäläisen klassisen kirjallisuuden skannausteoksiin. Venäjän kielen konerahaston lähteiden täydellinen arkisto koostuu nyt yli 100 miljoonasta sanankäytöstä;
Työ F. M. Dostojevskin kielen sanakirjasta [8] .
Lähteiden kerääminen venäläisen proosan laajaa levitystilastollista tutkimusta varten 1800-luvun viimeisellä kolmanneksella. ja 1900-luvun lopun sanomalehdet.
Jakelu-tilastotietojen kerääminen ja analysointi, tiivistelmätietojen julkaisujen valmistelu [9] .
Analyysi toimista venäjän kielen MF:n kehittämiseksi
Venäjän kielen MF:n kehittämisen käsite (1983)
- tietotekniikan tehtävien kielellisen tuen komponenttien luominen ja
- Venäjän tutkimuksen tieteellisen tutkimuksen informatointi.
Nykyaikaiset tehtävät MFRN:n luomisessa
- jakelu-tilastollinen analyysi ja kieliresurssien kerääminen Internetissä
- lähteiden kerääminen säätiön verkkosivuille
- Rahaston automaattisen sanastotiedoston toimintojen edelleen kehittäminen
- rahaston kaikkien tekstilähteiden maailmanlaajuisen kielistatistisen käsittelyn rakentaminen interaktiivisessa tilassa [10] .
Katso myös
Muistiinpanot
- ↑ Kirjassa julkaistut materiaalit: Venäjän kielen konerahasto: Ideas and Judgments, M .: Nauka , 1989
- ↑ Julkaistu V. M. Andryushchenkon kirjassa Venäjän kielen konerahaston käsite ja arkkitehtuuri, M .: 1989
- ↑ Julkaistu kirjassa Venäjän kielen konerahaston terminologisen tietopankin kielellinen käsite (projekti), toim. A.S. Gerda, M.: 1989
- ↑ Lähdearkiston sisältö julkaistiin Bulletin of the Machine Fund of the Russian Language, vol. yksi; se on nyt hyvin vanhentunut ja arkiston nykyinen tila näkyy parhaiten tässä: [ 1] Arkistoitu 13. syyskuuta 2007 Wayback Machinessa Wayback Machinessa
- ↑ Kehittäjä Zh. G. Anoshkina
- ↑ Kehittäjä L. I. Kolodyazhnaya
- ↑ Kuvaukset Venäjän kielen konerahaston tiedotteessa, vol. 1-3).
- ↑ Yu. N. Karaulovin johdolla
- ↑ Tällaisen julkaisun ensimmäinen tulos on A. Ya. Shaikevichin, V. M. Andryushchenkon ja N. A. Rebetskajan kirja "F. M. Dostojevskin kielen tilastollinen sanakirja"
- ↑ esimerkki tällaisesta käsittelystä on Dostojevskin kielen tilastosanakirjassa). V. M. Andryushchenko
Kirjallisuus
- Ershov A.P. Venäjän kielen konerahasto: ulkoinen asetus // Venäjän kielen konerahasto: ideoita ja tuomioita. M.: Nauka , 1986 .
- Andryushchenko V. M. Venäjän kielen konerahaston käsite ja arkkitehtuuri. M.: Nauka, 1989 .
- Andryushchenko V. M. Yhdistettyjen painosten kehittäminen (kirja + CD + Internet) // Moscow Linguistic Journal, vol. 7 No. 1, 2003 .
- Shaikevich A. Ya. Distributiivinen-tilastollinen analyysi semanttiikassa // Semanttisen tutkimuksen periaatteet ja menetelmät. Moskova: Nauka, 1976.
- Shaikevich A. Ya. Hypoteesit luonnollisista luokista ja kvantitatiivisen taksonomian mahdollisuudesta kielitieteessä // Hypoteesi nykyaikaisessa kielitieteessä. M.: Nauka, 1979 .
- Shaikevich A. Ya., Andryushchenko V. M., Rebetskaya N. A. Dostojevskin kielen tilastollinen sanakirja. M.: Slaavilaisen kulttuurin kielet, 2003 .
Linkit