Relevanssi (tietojen haku)

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 10. toukokuuta 2018 tarkistetusta versiosta . tarkastukset vaativat 11 muokkausta .

Relevanssi ( englanniksi  relevance  - relevance, relevance ) tiedonhaussa  - pyyntöön upotetun tarkoituksen (hakutarkoituksen) ja tämän pyynnön tuloksena saatujen hakukonetulosten vastaavuus. Hakukoneeseen kyselyn kirjoittava käyttäjä odottaa, että tulokset vastaavat hänen kyselyssä esittämänsä tarkoitusta, toisin sanoen hän saa asiaankuuluvan tulosteen.

Relevanssin arvioimiseen on useita tapoja. Sisällön relevanssi on tietopyyntöön annettujen vastausten vastaavuus, joka määritetään epävirallisella tavalla [1] . Muodollinen relevanssi on vastaavuus, joka määritetään vertaamalla hakukyselyn kuvaa vastauksen hakukuvaan tietyn algoritmin mukaisesti [1] .

Yksi yleisimmistä menetelmistä merkityksellisyyden arvioimiseksi on TF-IDF- menetelmä. Sen merkitys tiivistyy siihen tosiasiaan, että mitä suurempi on termin (kyselyn) paikallinen esiintymistiheys asiakirjassa (TF) ja sitä suurempi on termin "harvinaisuus" (eli sitä harvemmin se esiintyy muissa asiakirjoissa) kokoelma (IDF), sitä suurempi tämän vastauksen paino termiin suhteutettuna - eli vastaus annetaan aikaisemmin tämän termin hakutuloksissa. Menetelmän kirjoittaja on Gerard Salton , jota on edelleen  kehittänyt Karen Spark Jones [2] .

Asianmukaisuus ( lat.  pertineo - kosketa, liittyy ) - tiedonhakujärjestelmän löytämien tulosten vastaavuus käyttäjän tietotarpeisiin riippumatta siitä, kuinka täydellisesti ja kuinka tarkasti tämä tiedontarve on ilmaistu tietopyynnön tekstissä. Toisin sanoen tämä on hyödyllisen tiedon määrän suhde vastaanotetun tiedon kokonaismäärään [1] .

Relevanssiin vaikuttavat tekijät

Relevanssiin vaikuttavat tekijät jaetaan yleensä ulkoisiin ja sisäisiin . Ulkoiset sisältävät vertailumassan, sisäiset - tekniset komponentit ja sisällön.

Linkin paino. Mitä enemmän temaattisia ja laadukkaampia linkkejä johtaa resurssin sivuille, sitä todennäköisemmin resurssin arvo on käyttäjälle.  

Tekniset komponentit. Suuri joukko parametreja, joilla hakukone arvioi sekä sivuston kokonaisuutena että yksittäisiä sivuja (esimerkiksi sisällönkuvauskenttien olemassaolo, HTML-merkintöjen virheiden puuttuminen ja niin edelleen).

Sisältö. Avaintekijä, josta sivun ja tuloksen osuvuus riippuu . Sivuston sisällön on oltava ainutlaatuinen ja "ihmisille tarkoitettu".

Katso myös

Muistiinpanot

  1. 1 2 3 Kybernetiikan sanakirja / Toimittanut akateemikko V. S. Mikhalevich . - 2. - Kiova: M. P. Bazhanin mukaan nimetyn Ukrainan neuvostotietosanakirjan pääpainos, 1989. - 751 s. - (C48). – 50 000 kappaletta.  - ISBN 5-88500-008-5 .
  2. Jones KS Tilastollinen tulkinta termispesifisyydestä ja sen soveltaminen haussa  // Journal of Documentation : Journal. - MCB University: MCB University Press, 2004. - V. 60 , nro 5 . - S. 493-502 .

Kirjallisuus

Linkit