Lainausanalyysi on asiakirjojen viittausten tiheyden, mallien ja aikataulujen tutkimus. Se käyttää lainausmallia, linkkejä asiakirjasta toiseen asiakirjan ominaisuuksien selvittämiseen. Tyypillinen tavoite on tunnistaa kokoelman tärkeimmät asiakirjat. Klassinen esimerkki on lainaus akateemisten papereiden ja kirjojen välillä. [1] [2] Oikeudelliset päätökset anglosaksisessa oikeusjärjestelmässä viittaavat päätöstensä vahvistamiseksi aikaisemmissa asioissa tehtyihin päätöksiin, joten lainauksen analysointi oikeudellisessa kontekstissa on tärkeää. Toinen esimerkki ovat patentit, jotka sisältävät aikaisempia keksintöjä, aiemmin siteeratut patentit, jotka liittyvät nykyiseen patenttivaatimukseen.
Asiakirjoihin voidaan liittää viittausten lisäksi monia muita ominaisuuksia, kuten kirjoittajia, kustantajia, lehtiä sekä niiden varsinaisia tekstejä. Dokumenttikokoelmien yleistä analyysiä kutsutaan bibliometriikaksi , ja lainausanalyysi on keskeinen osa tätä suuntaa. Esimerkiksi bibliografinen linkitys ja jakaminen ovat viittausanalyysiin (jaetut lainaukset tai jaetut lainaukset) perustuvia mittareita. Artikkelikokoelman lainaukset voidaan esittää myös seuraavien lainauskaavioiden muodossa, kuten Derek de Solla Price totesi vuoden 1965 artikkelissa "Networks of Scientific Papers". [3] Tämä tarkoittaa, että lainausanalyysi perustuu sosiaalisten verkostojen analyysiin ja verkostotieteeseen.
Varhainen esimerkki automaattisesta viittausten indeksoinnista oli CiteSeer , jota käytettiin viittauksiin tieteellisissä raporteissa, ja Google Scholar on esimerkki nykyaikaisesta järjestelmästä, joka sisältää muutakin kuin akateemisia kirjoja ja artikkeleita ja heijastaa laajempaa valikoimaa tietolähteitä. Nykyään automaattinen viittausten indeksointi [4] on muuttanut lainausanalyysitutkimuksen luonnetta, mikä mahdollistaa miljoonien lainausten analysoinnin laajamittaisia malleja ja tiedon löytämistä varten. Tiedemiehet voivat käyttää viittausanalyysityökaluja laskeakseen eri vaikutusasteita viittausindeksitietojen perusteella . [5] [6] [7] Heillä on sovelluksia, jotka vaihtelevat asiantuntijatuomareiden tunnistamisesta asiakirjojen ja apurahaehdotusten tarkistamiseen ja läpinäkyvien tietojen toimittamiseen akateemisia ansioita, toimikausia ja päätöksentekoa koskevien päätösten tueksi. Tämä kilpailu rajallisista resursseista voi johtaa eettisesti kyseenalaiseen käyttäytymiseen lisääntyneiden viittausten vuoksi. [8] [9]
Käytäntöä käyttää naiivisti viittausanalyysiä eri tieteellisten artikkeleiden vaikutusten vertailuun ottamatta huomioon muita lainausmalleihin mahdollisesti vaikuttavia tekijöitä on arvosteltu voimakkaasti. [10] Kritiikin joukossa keskitytään johdonmukaisesti "toimialan riippumattomuuteen", nimittäin siihen, että viittauskäytännöt yhdellä tieteenalalla eroavat käytännöistä toisella ja jopa tieteenalojen tutkimusalojen välillä. [yksitoista]
Vaikka viittausindeksit kehitettiin alun perin tiedonhakuun , niitä käytetään yhä enemmän bibliometrisiin ja muihin tutkimusarviointiin liittyviin tutkimuksiin. Lainaustiedot ovat myös suositun lehden vaikutustekijän perusta.
Viittausanalyysistä on olemassa suuri määrä kirjallisuutta, jota joskus kutsutaan skientometriikaksi , Vasili Nalimovin keksimäksi termiksi , tai tarkemmin sanottuna bibliometriikaksi . Ala alkoi kukoistaa Science Citation Indexin myötä, joka kattaa vuodesta 1900 lähtien julkaistun kirjallisuuden. Alan johtavat aikakauslehdet ovat Scientometrics , Informatics ja Journal of the Association for Information Science and Technology. Jälkimmäinen järjestää myös sähköisen postituslistan nimeltä Sigmetrica ATIT:ssä. [12] Tätä menetelmää elvytetään laajalti tietokantojen käyttöönoton, Web Science- ja Scopus-tilausten monissa yliopistoissa sekä julkisten ilmaisten lainaustyökalujen, kuten CiteBase, CiteSeerX , Google Scholar ja entisen Windows Live Academic -ohjelman (nyt saatavilla lisäominaisuuksilla, kuten kuten Microsoft Academic Search). Lainausanalyysin tutkimusmenetelmiä ovat laadulliset, kvantitatiiviset ja laskennalliset lähestymistavat. Tällaisten scientometristen tutkimusten pääpainopisteet ovat olleet suorituskyvyn benchmarking, instituutioiden tutkimusten sijoitukset, aikakauslehtien luokittelu [13] suorituskykytekijöiden ja omistusstandardien asettamiseksi, [14] huipputieteellisten julkaisujen vaikutusten arviointi, [15] tieteen kehityskulkujen seuranta tai teknologiateollisuus [16] ja tutkimustulosten johtavien tekijöiden ja instituutioiden profiilien kehittäminen. [17]
Lakiviittausanalyysi on lainausanalyysitekniikka oikeudellisten asiakirjojen analysointiin, mikä helpottaa asiaan liittyvien normatiivisten asiakirjojen ymmärtämistä tarkastelemalla viittauksia, jotka linkittävät säännöksen muihin säännöksiin samassa asiakirjassa tai eri asiakirjojen välillä. Oikeudellinen viittausanalyysi käyttää säädösasiakirjasta otettua lainauskaaviota, joka voi täydentää sähköistä löytöä, prosessia, joka vaikuttaa teknologisiin innovaatioihin big datan analytiikan alalla . [18] [19] [20] [21]
Derek de Solla Price kuvaili vuoden 1965 julkaisussa SCI:n luontaista sitovaa ominaisuutta "tieteellisten papereiden verkostoksi". Linkit siteerausten ja siteerattujen papereiden välillä muuttuivat dynaamisiksi, kun SCI alkoi julkaista verkossa. Social Science Citation Index oli yksi ensimmäisistä tietokannoista, jotka asennettiin Dialog-järjestelmään [22] vuonna 1972. CD-levyjen myötä viittaukset ovat entistä yksinkertaisempia, mikä mahdollistaa bibliografisten linkkien käytön vastaavien tietueiden etsimiseen. Henry Small julkaisi vuonna 1973 klassisen yhteisviittausanalyysin työnsä, josta tuli itseorganisoitunut luokitusjärjestelmä, joka johti dokumenttien klusterointikokeiluun ja lopulta Tieteen atlasiin, josta tuli myöhemmin Research Reviews.
Ralph Garner (Drexel University) kuvasi tieteelliseen kirjallisuuteen kuuluvan maailmanlaajuisen lainausverkon luontaisen topologisen ja graafisen luonteen vuonna 1965. [23]
Viittauspisteiden käyttö ranking-lehdissä oli yleinen käytäntö 1800-luvun ensimmäisellä puoliskolla, mutta näiden pisteiden systemaattisen jatkuvan mittaamisen tieteellisissä lehdissä aloitti Eugene Garfield Institute for Scientific Informationista, josta tuli myös ensisijainen lähde. näiden pisteiden käyttämisestä kirjoittajien ja artikkeleiden arvioimiseen. Merkittävässä vuoden 1965 paperissa hän ja Irving Sher osoittivat taajuuden ja viittausten kasvun välisen suhteen osoittaen, että Nobel-palkinnon saajat julkaisivat artikkelinsa keskimäärin viisi kertaa, kun taas heidän kirjoituksiaan siteerattiin keskimäärin 30-50 kertaa. Garfield kertoi tästä ilmiöstä pitkässä sarjassa esseitä Nobel- ja muista palkinnoista. Tavanomainen lopullinen pistemäärä tunnetaan vaikutussuhteena , joka on kahden edellisen vuoden viittausten määrä jaettuna kyseisinä vuosina julkaistujen artikkelien määrällä. Sitä käytetään laajalti sekä tavallisiin että erikoistarkoituksiin, erityisesti sen käyttö tekijöiden ja asiakirjojen arvioinnissa on melko kiistanalaista .
Vuoden 1964 alussa tehdyssä tutkimuksessa, jossa käytettiin viittausanalyysiä DNA -historian kirjoittamisessa, Garfield ja Sher osoittivat potentiaalin tuottaa historiografiaa , topologisia karttoja tieteellisten aiheiden historian tärkeimmistä vaiheista. Tämän työn automatisoivat myöhemmin E. Garfield, A. I. Pudovkin kansallisen tiedeakatemian meribiologian instituutista ja V. S. Istomin Washingtonin osavaltion yliopiston opetus-, oppimis- ja teknologiakeskuksesta, ja se johti Histcite-ohjelmiston luomiseen [ 24] vuoteen 2002 mennessä.
Lee Giles, Steve Lawrence ja Kurt Bollacker ottivat käyttöön automaattisen viittausindeksin vuonna 1998, ja se mahdollisti automaattisen algoritmisen poistamisen ja lainausten ryhmittelyn kaikissa digitaalisissa akateemisissa ja tieteellisissä dokumenteissa. Kun viittausten ennakkoperuutus oli manuaalinen prosessi, viittausprosenttia voidaan nyt nostaa ja laskea mille tahansa akateemiselle haaralle tai tapahtumapaikalle, ei vain ISI:n kaltaisten organisaatioiden myöntämille. Tämä johti uusien julkisten ja automaattisten viittausten indeksointijärjestelmien luomiseen, joista ensimmäinen oli CiteSeer (nykyisin CiteSeerX , pian Cora-järjestelmän perimä, joka keskittyi ensisijaisesti tietojenkäsittelytieteeseen ja tietojenkäsittelytieteeseen . Myöhemmin suuret akateemiset verkkotunnusjärjestelmät, kuten kuten Google Scholar ja Microsoft Academic Tätä offline-sitaatin indeksointia ei ole vielä täydennetty viittausten poiminnassa tai viittausten klusteroinnissa virheprosentin arvioidaan olevan noin 10 %, vaikka huolellista tilastollista otantaa ei ole vielä tehty.Tekijät, kuten Ann Arbor , Milton Keynes ja Walton Hall ovat tuottaneet valtavan määrän akateemisia tuloksia.25 SCI väittää luovansa automaattisen viittausindeksoinnin puhtaasti ohjelmallisilla menetelmillä. Jopa vanhemmissa merkinnöissä on sama virhemarginaali.
Oikeudellisten asiakirjojen lainausanalyysi on lähestymistapa, joka auttaa ymmärtämään ja analysoimaan asiaan liittyviä normatiivisia asiakirjoja tarkastelemalla lainauksia, jotka yhdistävät säännöksen muihin säännöksiin samassa asiakirjassa ja eri asiakirjojen välillä. Lainausanalyysi käyttää viittauskaaviota, joka on johdettu normatiivisesta asiakirjasta, joka voisi täydentää sähköistä löytöä, prosessia, joka ohjaa teknisiä innovaatioita big datan analytiikan alalla. [26]
Sähköiset julkaisut . Sähköisten resurssien saatavuuden ennennäkemättömän lisääntymisen vuoksi yhdeksi polttavista kysymyksistä, joita nyt tutkitaan, on noussut kysymys "kuinka usein sähköisiä resursseja lainataan internetissä toimialallani?". [27] On esimerkiksi väitetty, että tietojenkäsittelytieteen kirjallisuuden online-käyttö johtaa korkeampiin viittausprosenttiin, [28] kuitenkin humanistiset artikkelit voivat kärsiä, jos niitä ei ole painettuina.
Itse lainaamalla . Kirjoittajien käytäntöä "leikkiä" järjestelmällä keräämällä sitaatteja ja lainaamalla liikaa itseään [29] on kritisoitu paljon . Samaan aikaan esimerkiksi todettiin, että miehet lainaavat itseään useammin kuin naiset.