Relevanssi ( englanniksi relevance - relevance, relevance ) tiedonhaussa - pyyntöön upotetun tarkoituksen (hakutarkoituksen) ja tämän pyynnön tuloksena saatujen hakukonetulosten vastaavuus. Hakukoneeseen kyselyn kirjoittava käyttäjä odottaa, että tulokset vastaavat hänen kyselyssä esittämänsä tarkoitusta, toisin sanoen hän saa asiaankuuluvan tulosteen.
Relevanssin arvioimiseen on useita tapoja. Sisällön relevanssi on tietopyyntöön annettujen vastausten vastaavuus, joka määritetään epävirallisella tavalla [1] . Muodollinen relevanssi on vastaavuus, joka määritetään vertaamalla hakukyselyn kuvaa vastauksen hakukuvaan tietyn algoritmin mukaisesti [1] .
Yksi yleisimmistä menetelmistä merkityksellisyyden arvioimiseksi on TF-IDF- menetelmä. Sen merkitys tiivistyy siihen tosiasiaan, että mitä suurempi on termin (kyselyn) paikallinen esiintymistiheys asiakirjassa (TF) ja sitä suurempi on termin "harvinaisuus" (eli sitä harvemmin se esiintyy muissa asiakirjoissa) kokoelma (IDF), sitä suurempi tämän vastauksen paino termiin suhteutettuna - eli vastaus annetaan aikaisemmin tämän termin hakutuloksissa. Menetelmän kirjoittaja on Gerard Salton , jota on edelleen kehittänyt Karen Spark Jones [2] .
Asianmukaisuus ( lat. pertineo - kosketa, liittyy ) - tiedonhakujärjestelmän löytämien tulosten vastaavuus käyttäjän tietotarpeisiin riippumatta siitä, kuinka täydellisesti ja kuinka tarkasti tämä tiedontarve on ilmaistu tietopyynnön tekstissä. Toisin sanoen tämä on hyödyllisen tiedon määrän suhde vastaanotetun tiedon kokonaismäärään [1] .
Relevanssiin vaikuttavat tekijät jaetaan yleensä ulkoisiin ja sisäisiin . Ulkoiset sisältävät vertailumassan, sisäiset - tekniset komponentit ja sisällön.
Linkin paino. Mitä enemmän temaattisia ja laadukkaampia linkkejä johtaa resurssin sivuille, sitä todennäköisemmin resurssin arvo on käyttäjälle.
Tekniset komponentit. Suuri joukko parametreja, joilla hakukone arvioi sekä sivuston kokonaisuutena että yksittäisiä sivuja (esimerkiksi sisällönkuvauskenttien olemassaolo, HTML-merkintöjen virheiden puuttuminen ja niin edelleen).
Sisältö. Avaintekijä, josta sivun ja tuloksen osuvuus riippuu . Sivuston sisällön on oltava ainutlaatuinen ja "ihmisille tarkoitettu".