Lainausanalyysi

Lainausanalyysi  on asiakirjojen viittausten tiheyden, mallien ja aikataulujen tutkimus. Se käyttää lainausmallia, linkkejä asiakirjasta toiseen asiakirjan ominaisuuksien selvittämiseen. Tyypillinen tavoite on tunnistaa kokoelman tärkeimmät asiakirjat. Klassinen esimerkki on lainaus akateemisten papereiden ja kirjojen välillä. [1] [2] Oikeudelliset päätökset anglosaksisessa oikeusjärjestelmässä viittaavat päätöstensä vahvistamiseksi aikaisemmissa asioissa tehtyihin päätöksiin, joten lainauksen analysointi oikeudellisessa kontekstissa on tärkeää. Toinen esimerkki ovat patentit, jotka sisältävät aikaisempia keksintöjä, aiemmin siteeratut patentit, jotka liittyvät nykyiseen patenttivaatimukseen.

Asiakirjoihin voidaan liittää viittausten lisäksi monia muita ominaisuuksia, kuten kirjoittajia, kustantajia, lehtiä sekä niiden varsinaisia ​​tekstejä. Dokumenttikokoelmien yleistä analyysiä kutsutaan bibliometriikaksi , ja lainausanalyysi on keskeinen osa tätä suuntaa. Esimerkiksi bibliografinen linkitys ja jakaminen ovat viittausanalyysiin (jaetut lainaukset tai jaetut lainaukset) perustuvia mittareita. Artikkelikokoelman lainaukset voidaan esittää myös seuraavien lainauskaavioiden muodossa, kuten Derek de Solla Price totesi  vuoden 1965 artikkelissa "Networks of Scientific Papers". [3] Tämä tarkoittaa, että lainausanalyysi perustuu sosiaalisten verkostojen analyysiin ja verkostotieteeseen.

Varhainen esimerkki automaattisesta viittausten indeksoinnista oli CiteSeer , jota käytettiin viittauksiin tieteellisissä raporteissa, ja Google Scholar on esimerkki nykyaikaisesta järjestelmästä, joka sisältää muutakin kuin akateemisia kirjoja ja artikkeleita ja heijastaa laajempaa valikoimaa tietolähteitä. Nykyään automaattinen viittausten indeksointi [4] on muuttanut lainausanalyysitutkimuksen luonnetta, mikä mahdollistaa miljoonien lainausten analysoinnin laajamittaisia ​​malleja ja tiedon löytämistä varten. Tiedemiehet voivat käyttää viittausanalyysityökaluja laskeakseen eri vaikutusasteita viittausindeksitietojen perusteella . [5] [6] [7] Heillä on sovelluksia, jotka vaihtelevat asiantuntijatuomareiden tunnistamisesta asiakirjojen ja apurahaehdotusten tarkistamiseen ja läpinäkyvien tietojen toimittamiseen akateemisia ansioita, toimikausia ja päätöksentekoa koskevien päätösten tueksi. Tämä kilpailu rajallisista resursseista voi johtaa eettisesti kyseenalaiseen käyttäytymiseen lisääntyneiden viittausten vuoksi. [8] [9]

Käytäntöä käyttää naiivisti viittausanalyysiä eri tieteellisten artikkeleiden vaikutusten vertailuun ottamatta huomioon muita lainausmalleihin mahdollisesti vaikuttavia tekijöitä on arvosteltu voimakkaasti. [10] Kritiikin joukossa keskitytään johdonmukaisesti "toimialan riippumattomuuteen", nimittäin siihen, että viittauskäytännöt yhdellä tieteenalalla eroavat käytännöistä toisella ja jopa tieteenalojen tutkimusalojen välillä. [yksitoista]

Yleiskatsaus

Vaikka viittausindeksit kehitettiin alun perin tiedonhakuun , niitä käytetään yhä enemmän bibliometrisiin  ja muihin tutkimusarviointiin liittyviin tutkimuksiin. Lainaustiedot ovat myös suositun lehden vaikutustekijän perusta.

Viittausanalyysistä on olemassa suuri määrä kirjallisuutta, jota joskus kutsutaan skientometriikaksiVasili Nalimovin keksimäksi termiksi , tai tarkemmin sanottuna bibliometriikaksi . Ala alkoi kukoistaa Science Citation Indexin myötä, joka kattaa vuodesta 1900 lähtien julkaistun kirjallisuuden. Alan johtavat aikakauslehdet ovat Scientometrics , Informatics ja Journal of the Association for Information Science and Technology. Jälkimmäinen järjestää myös sähköisen postituslistan nimeltä Sigmetrica ATIT:ssä. [12] Tätä menetelmää elvytetään laajalti tietokantojen käyttöönoton, Web Science- ja Scopus-tilausten monissa yliopistoissa sekä julkisten ilmaisten lainaustyökalujen, kuten CiteBase, CiteSeerX , Google Scholar ja entisen Windows Live Academic -ohjelman (nyt saatavilla lisäominaisuuksilla, kuten kuten Microsoft Academic Search). Lainausanalyysin tutkimusmenetelmiä ovat laadulliset, kvantitatiiviset ja laskennalliset lähestymistavat. Tällaisten scientometristen tutkimusten pääpainopisteet ovat olleet suorituskyvyn benchmarking, instituutioiden tutkimusten sijoitukset, aikakauslehtien luokittelu [13] suorituskykytekijöiden ja omistusstandardien asettamiseksi, [14] huipputieteellisten julkaisujen vaikutusten arviointi, [15] tieteen kehityskulkujen seuranta tai teknologiateollisuus [16] ja tutkimustulosten johtavien tekijöiden ja instituutioiden profiilien kehittäminen. [17]

Lakiviittausanalyysi on lainausanalyysitekniikka oikeudellisten asiakirjojen analysointiin, mikä helpottaa asiaan liittyvien normatiivisten asiakirjojen ymmärtämistä tarkastelemalla viittauksia, jotka linkittävät säännöksen muihin säännöksiin samassa asiakirjassa tai eri asiakirjojen välillä. Oikeudellinen viittausanalyysi käyttää säädösasiakirjasta otettua lainauskaaviota, joka voi täydentää sähköistä löytöä, prosessia, joka vaikuttaa teknologisiin innovaatioihin big datan analytiikan alalla . [18] [19] [20] [21]

Historia

Derek de Solla Price kuvaili vuoden 1965 julkaisussa SCI:n luontaista sitovaa ominaisuutta "tieteellisten papereiden verkostoksi". Linkit siteerausten ja siteerattujen papereiden välillä muuttuivat dynaamisiksi, kun SCI alkoi julkaista verkossa. Social Science Citation Index oli yksi ensimmäisistä tietokannoista, jotka asennettiin Dialog-järjestelmään [22] vuonna 1972. CD-levyjen myötä viittaukset ovat entistä yksinkertaisempia, mikä mahdollistaa bibliografisten linkkien käytön vastaavien tietueiden etsimiseen. Henry Small julkaisi vuonna 1973 klassisen yhteisviittausanalyysin työnsä, josta tuli  itseorganisoitunut  luokitusjärjestelmä, joka johti dokumenttien klusterointikokeiluun ja lopulta Tieteen atlasiin, josta tuli myöhemmin Research Reviews.

Ralph Garner (Drexel University) kuvasi tieteelliseen kirjallisuuteen kuuluvan maailmanlaajuisen lainausverkon luontaisen topologisen ja graafisen luonteen vuonna 1965. [23]

Viittauspisteiden käyttö ranking-lehdissä oli yleinen käytäntö 1800-luvun ensimmäisellä puoliskolla, mutta näiden pisteiden systemaattisen jatkuvan mittaamisen tieteellisissä lehdissä aloitti Eugene Garfield Institute for Scientific Informationista, josta tuli myös ensisijainen lähde. näiden pisteiden käyttämisestä kirjoittajien ja artikkeleiden arvioimiseen. Merkittävässä vuoden 1965 paperissa hän ja Irving Sher osoittivat taajuuden ja viittausten kasvun välisen suhteen osoittaen, että Nobel-palkinnon saajat julkaisivat artikkelinsa keskimäärin viisi kertaa, kun taas heidän kirjoituksiaan siteerattiin keskimäärin 30-50 kertaa. Garfield kertoi tästä ilmiöstä pitkässä sarjassa esseitä Nobel- ja muista palkinnoista. Tavanomainen lopullinen pistemäärä tunnetaan vaikutussuhteena , joka on kahden edellisen vuoden viittausten määrä jaettuna kyseisinä vuosina julkaistujen artikkelien määrällä. Sitä käytetään laajalti sekä tavallisiin että erikoistarkoituksiin, erityisesti sen käyttö tekijöiden ja asiakirjojen arvioinnissa on melko kiistanalaista .

Vuoden 1964 alussa tehdyssä tutkimuksessa, jossa käytettiin viittausanalyysiä DNA -historian kirjoittamisessa, Garfield ja Sher osoittivat potentiaalin tuottaa historiografiaa , topologisia karttoja tieteellisten aiheiden historian tärkeimmistä vaiheista. Tämän työn automatisoivat myöhemmin E. Garfield, A. I. Pudovkin kansallisen tiedeakatemian meribiologian instituutista ja V. S. Istomin Washingtonin osavaltion yliopiston opetus-, oppimis- ja teknologiakeskuksesta, ja se johti Histcite-ohjelmiston luomiseen [ 24] vuoteen 2002 mennessä.

Lee Giles, Steve Lawrence ja Kurt Bollacker ottivat käyttöön automaattisen viittausindeksin vuonna 1998, ja se mahdollisti automaattisen algoritmisen poistamisen ja lainausten ryhmittelyn kaikissa digitaalisissa akateemisissa ja tieteellisissä dokumenteissa. Kun viittausten ennakkoperuutus oli manuaalinen prosessi, viittausprosenttia voidaan nyt nostaa ja laskea mille tahansa akateemiselle haaralle tai tapahtumapaikalle, ei vain ISI:n kaltaisten organisaatioiden myöntämille. Tämä johti uusien julkisten ja automaattisten viittausten indeksointijärjestelmien luomiseen, joista ensimmäinen oli CiteSeer (nykyisin CiteSeerX , pian Cora-järjestelmän perimä, joka keskittyi ensisijaisesti tietojenkäsittelytieteeseen ja tietojenkäsittelytieteeseen . Myöhemmin suuret akateemiset verkkotunnusjärjestelmät, kuten kuten Google Scholar ja Microsoft Academic Tätä offline-sitaatin indeksointia ei ole vielä täydennetty viittausten poiminnassa tai viittausten klusteroinnissa virheprosentin arvioidaan olevan noin 10 %, vaikka huolellista tilastollista otantaa ei ole vielä tehty.Tekijät, kuten Ann Arbor , Milton Keynes ja Walton Hall ovat tuottaneet valtavan määrän akateemisia tuloksia.25 SCI väittää luovansa automaattisen viittausindeksoinnin puhtaasti ohjelmallisilla menetelmillä. Jopa vanhemmissa merkinnöissä on sama virhemarginaali.

Oikeudellisten asiakirjojen lainausanalyysi

Oikeudellisten asiakirjojen lainausanalyysi on lähestymistapa, joka auttaa ymmärtämään ja analysoimaan asiaan liittyviä normatiivisia asiakirjoja tarkastelemalla lainauksia, jotka yhdistävät säännöksen muihin säännöksiin samassa asiakirjassa ja eri asiakirjojen välillä. Lainausanalyysi käyttää viittauskaaviota, joka on johdettu normatiivisesta asiakirjasta, joka voisi täydentää sähköistä löytöä, prosessia, joka ohjaa teknisiä innovaatioita big datan analytiikan alalla. [26]

Kritiikki

Sähköiset julkaisut . Sähköisten resurssien saatavuuden ennennäkemättömän lisääntymisen vuoksi yhdeksi polttavista kysymyksistä, joita nyt tutkitaan, on noussut kysymys "kuinka usein sähköisiä resursseja lainataan internetissä toimialallani?". [27] On esimerkiksi väitetty, että tietojenkäsittelytieteen kirjallisuuden online-käyttö johtaa korkeampiin viittausprosenttiin, [28] kuitenkin humanistiset artikkelit voivat kärsiä, jos niitä ei ole painettuina.

Itse lainaamalla . Kirjoittajien käytäntöä "leikkiä" järjestelmällä keräämällä sitaatteja ja lainaamalla liikaa itseään [29] on kritisoitu paljon . Samaan aikaan esimerkiksi todettiin, että miehet lainaavat itseään useammin kuin naiset.

Katso myös

Muistiinpanot

  1. Rubin, Richard. Kirjasto- ja tietotieteen perusteet  (englanti) . – 3. - New York: Neal-Schuman Publishers, 2010. - ISBN 978-1-55570-690-6 .
  2. Garfield, E. Lainausindeksointi – sen teoria ja sovellus tieteessä, teknologiassa ja humanistisissa tieteissä Philadelphia: ISI Press, 1983. . Haettu 29. elokuuta 2018. Arkistoitu alkuperäisestä 9. maaliskuuta 2018.
  3. Derek J. de Solla Price. Networks of Scientific Papers  (englanniksi)  // Science  : Journal. - 1965. - 30. heinäkuuta ( nide 149 , nro 3683 ). - s. 510-515 . - doi : 10.1126/tiede.149.3683.510 . - . — PMID 14325149 .
  4. Giles, C. Lee; Bollacker, Kurt D. & Lawrence, Steve (1998), CiteSeer: automaattinen viittausten indeksointijärjestelmä. , Digital libraries 98 : The Third ACM Conference on Digital Libraries, 23.–26.6.1998, Pittsburgh, PA (New York: Association for Computing Machinery): 89–98, ISBN 0-89791-965-3 , doi : 10.1145 276675.276685 , < http://doi.acm.org/10.1145/276675.276685 > . Haettu 7. heinäkuuta 2011. 
  5. Esimerkkejä ovat tilauspohjaiset omistustietoihin perustuvat työkalut, kuten Web of Science ja Scopus , sekä avoimeen dataan perustuvat ilmaiset työkalut, kuten Filippo Menczer ja hänen tiiminsä Scholarometer Arkistoitu 18. huhtikuuta 2022 Wayback Machinessa .
  6. Kaur, Jasleen. Scholarometer: A Social Framework for Analyzing Impact across Disciplines  (englanniksi)  // PLoS ONE  : Journal. - 2012. - Vol. 7 , ei. 9 . - doi : 10.1371/journal.pone.0043235 . - . — PMID 22984414 .
  7. Hoang, D.; Kaur, J. & Menczer, F. (2010), Crowdsourcing Scholarly Data , Proceedings of the WebSci10: Extending the Frontiers of Society On-Line, 26.-27.4.2010, Raleigh, NC: USA , < http:/ /journal .webscience.org/321/ > . Haettu 29. elokuuta 2018. Arkistoitu 17. huhtikuuta 2015 Wayback Machineen 
  8. Anderson, MS pakettiauto.  Kilpailun kieroutuneet vaikutukset tutkijoiden työhön ja suhteeseen  // Tiede ja tekniikan etiikka : päiväkirja. - 2007. - Voi. 4 , ei. 13 . - s. 437-461 . - doi : 10.1007/s11948-007-9042-5 .
  9. Wesel, M. van. Arviointi viittauksella: julkaisukäyttäytymisen trendit, arviointikriteerit ja pyrkimys suuriin julkaisuihin   // Tiede ja tekniikan etiikka : päiväkirja. - 2016. - Vol. 22 , ei. 1 . - s. 199-225 . - doi : 10.1007/s11948-015-9638-0 . — PMID 25742806 .
  10. Mitä viittausmäärät mittaavat? Katsaus viittauskäyttäytymistä koskeviin tutkimuksiin  //  Journal of Documentation : päiväkirja. - 2008. - Voi. 64 , nro. 1 . - s. 45-80 . - doi : 10.1108/00220410810844150 .
  11. Anauati, Maria Victoria ja Galiani, Sebastian ja Gálvez, Ramiro H., Quantifying the Life Cycle of Scholarly Articles Across Fields of Economic Research (11. marraskuuta 2014). Saatavilla osoitteessa SSRN: http://ssrn.com/abstract=2523078 Arkistoitu 17. marraskuuta 2014.
  12. American Society for Information Science & Technology (pääsemätön linkki) . Tietoyhteiskunta tiedon aikakaudella . Haettu 21. toukokuuta 2006. Arkistoitu alkuperäisestä 3. lokakuuta 2019. 
  13. Lowry, Paul Benjamin; Moody, Gregory D.; Gaskin, James; Galletta, Dennis F.; Humpherys, Sean; Barlow, Jordan B.; ja Wilson, David W. (2013). " Evaluing Journal Quality and Association for Information Systems (AIS) Senior Scholars' -lehtikori bibliometristen mittareiden avulla: tuovatko asiantuntijalehtien arvioinnit lisäarvoa? Arkistoitu 21. maaliskuuta 2019, Wayback Machine , MIS Quarterly (MISQ), vol. 37(4) , 993-1012. YouTube katso myös tämän artikkelin videoselostuksen osoitteessa: https://www.youtube.com/watch?v=LZQIDkA-ke0&feature=youtu.be Arkistoitu 21. maaliskuuta 2019 Wayback Machinessa .
  14. Dean, Douglas L; Lowry, Paul Benjamin; ja Humpherys, Sean (2011). Yhdysvaltain instituutioiden vakinaisten tietojärjestelmien tiedekunnan tutkimuksen tuottavuuden profilointi Arkistoitu 9. tammikuuta 2016 osoitteessa Wayback Machine , MIS Quarterly (MISQ), voi . 35(1), ss. 1-15 ( ISSN 0276-7783 ).
  15. Karuga, Gilbert G.; Lowry, Paul Benjamin; ja Richardson, Vernon J. (2007). Arvioidaan johtavan tietojärjestelmätutkimuksen vaikutusta ajan mittaan, Communications of the Association for Information Systems, voi. 19(7), s. 115-131 (http://aisel.aisnet.org/cais/vol19/iss1/7) Arkistoitu 25. tammikuuta 2016 Wayback Machinessa
  16. Liu, John S. Integroitu lähestymistapa pääpolun analysointiin: Hirsch-indeksin kehittäminen esimerkkinä  //  Journal of the American Society for Information Science and Technology : päiväkirja. - 2012. - 1. maaliskuuta ( nide 63 , nro 3 ). - s. 528-542 . — ISSN 1532-2890 . - doi : 10.1002/asi.21692 .
  17. Lowry, Paul Benjamin; Karuga, Gilbert G.; ja Richardson, Vernon J. (2007). Arvioidaan johtavia instituutioita, tiedekuntia ja artikkeleita tärkeimmissä tietojärjestelmien tutkimuslehdissä, Communications of the Association for Information Systems, vol. 20(16), s. 142-203 (http://aisel.aisnet.org/cais/vol20/iss1/16). Arkistoitu 9. tammikuuta 2016 Wayback Machinessa
  18. http://ieeexplore.ieee.org/search/wrapper.jsp?arnumber=5070630&tag=1  (alalinkki 29.8.2018 [1517 päivää])
  19. Mohammad Hamdaqa ja A. Hamou-Lhadj, "Citation Analysis: An Approach for Facilitating the Understanding and Analysis of Regulatory Compliance Documents", julkaisussa Proc. 6. kansainvälisessä tietotekniikkakonferenssissa Las Vegasissa, Yhdysvalloissa
  20. E-Discoveryn erikoisraportti: Epälineaarisen katsauksen nousuvesi . Hudson Global . Haettu 1. heinäkuuta 2012. Arkistoitu alkuperäisestä 3. heinäkuuta 2012. Cat Casey ja Alejandra Perez
  21. Mitä teknologia-avusteinen elektroninen löytö opettaa meille ihmisten roolista teknologiassa - Teknologia-avusteinen katsaus uudelleen inhimillistämiseen . Forbes . Haettu 1. heinäkuuta 2012. Arkistoitu alkuperäisestä 18. kesäkuuta 2012.
  22. Dialog, Thomson Business . "Dialog keksi online-tietopalvelut" . Haettu 21. toukokuuta 2006. Arkistoitu alkuperäisestä 13. tammikuuta 2004.
  23. Arkistoitu kopio . Haettu 29. elokuuta 2018. Arkistoitu alkuperäisestä 9. syyskuuta 2017.
  24. Eugene Garfield Algorithmic Citation-Linked Historiography – Mapping the Literature of Science . Esitteli ASIS&T 2002: Information, Connections and Community. ASISTin 65. vuosikokous Philadelphiassa, PA. 18.–21. marraskuuta 2002 (2002). Haettu 21. toukokuuta 2006. Arkistoitu alkuperäisestä 20. lokakuuta 2016.
  25. Postellon DC Hall ja Keynes liittyvät Arboriin viittaushakemistoissa  // Nature  :  Journal. - 2008. - maaliskuu ( osa 452 , nro 7185 ). - doi : 10.1038/452282b . — . — PMID 18354457 .
  26. Hamdaqa, M.; Hamou-Lhadj. Lainausanalyysi: lähestymistapa sääntelyn noudattamista koskevien asiakirjojen ymmärtämisen ja analysoinnin helpottamiseksi  . - Las Vegas, NV: Institute of Electrical and Electronics Engineers , 2009. - P. 278-283. - ISBN 978-1-4244-3770-2 . - doi : 10.1109/ITNG.2009.161 .
  27. Zhao, Lisa. "Kuinka kirjastonhoitaja käytti sähköisiä resursseja - CCQ:n lainausten analyysi." Luettelointi ja luokittelu Quarterly 42(1) (2006): 117-131.
  28. Lawrence, Steve. Ilmainen saatavuus verkossa lisää merkittävästi lehden vaikutusta. Nature-teos 411 (numero 6837) (2001): 521. Myös verkossa osoitteessa http://citeseer.ist.psu.edu/online-nature01/ Arkistoitu 9. kesäkuuta 2010 Wayback Machinessa
  29. Gálvez RH Arvioimassa kirjoittajan itseviittausta asiaankuuluvan tiedon leviämisen mekanismina  //  Scientometrics : Journal. - 2017. - maaliskuu ( osa 111 , nro 3 ). - s. 1801 . - doi : 10.1007/s11192-017-2330-1 .