Tunnistepilvi ( sanapilvi , tai painotettu luettelo, visuaalisesti esitetty) on visuaalinen esitys kategorioiden luettelosta (tai tunnisteista, joita kutsutaan myös tunnisteiksi, tunnisteiksi, avainsanoiksi jne.) [1] Yleensä käytetään kuvaamaan tageja (metadata) verkkosivustoilla. tai edustamaan pelkkää tekstiä. Avainsanat ovat useimmiten yksittäisiä sanoja, ja kunkin avainsanan tärkeys näkyy kirjasinkoolla tai värillä . Tämä esitys on kätevä tunnetuimpien termien nopeaan havaitsemiseen ja termien jakautumiseen suosion mukaan suhteessa toisiinsa . Kun avainsanoja käytetään helpottamaan verkkosivuilla liikkumista, termit linkitetään avainsanoilla tarkoitettuihin käsitteisiin. Pilvi ei kuitenkaan voi olla ainoa navigoinnin elementti, ja tekstihaun avulla on helpompi hakea, jos etsimisestä on tarkempaa tietoa [2] .
Visuaalisen suunnittelun kielellä tagipilvi (tai sanapilvi) on eräänlainen "painotettu luettelo", jota käytetään yleisesti maantieteellisissä kartoissa kaupunkien suhteellisen koon näyttämiseen kirjasinkokoja käyttäen. Yksi varhaisimmista esimerkeistä englanninkielisten avainsanojen painotetusta luettelosta on Douglas Copelandin romaanissa Slaves of Microsoft (1995) oleva luettelo "alitajuisista tietokonetiedostoista" . Luettelo saksalaisista sanoista ilmestyi vuonna 1992 [3] .
Termin "tunnistepilvi" erityinen visuaalinen esittäminen ja levittäminen alkoi 2000-luvun ensimmäisellä vuosikymmenellä. Web 2.0 -aikakauden sivustoille ja blogeille ominaisena ominaisuutena sitä käytettiin pääasiassa verkkosivuston sisältöä kuvaavien ja navigointia helpottavien metadata-avainsanojen taajuusjakauman visualisointiin.
Ensimmäiset tunnistepilvet tunnetuilla verkkosivustoilla ilmestyivät Flickriin , digitaalisten valokuvien säilytys- ja jakelusivustolle . Tagpilvet loi Flickrin toinen perustaja ja suunnittelija Stuart Butterfield vuonna 2004. Tämä toteutus perustui James Flanaganin kirjaan Search Referral Zeitgeist [4] , joka kuvaa verkkosivustolinkkien visualisointia. Samoihin aikoihin Web-sivustot Delicious ja Technorati auttoivat levittämään tunnistepilveä .
Tunnistepilvien runsaus ja epäselvyys niiden hyödyllisyydestä verkkonavigoinnin apuvälineinä on johtanut niiden käytön huomattavaan vähenemiseen uraauurtavilla sivustoilla [5] . (Flickrin tekijät "pyysivät" anteeksi verkkoyhteisöltä Webby Awards -puheessaan , jossa he sanoivat yksinkertaisesti "anteeksi tunnistepilvet" [6] .)
Toisen sukupolven ohjelmistokehitys on paljastanut laajan valikoiman sovelluksia tunnistepilville tärkeimpinä menetelminä tekstidatan visualisoinnissa. Näihin navigointielementteihin on myös ehdotettu joitain laajennuksia. Esimerkiksi rinnakkaiset tagpilvet [ 7] , sparkClouds [8] ja etuliitetunnistepilvet [9] .
Tällä hetkellä tunnistepilvellä ei ole niin suurta suosiota, ja se vaikuttaa joissakin tapauksissa jopa negatiivisesti sivuston hakukonemainontaan . Joten jos teet pilven, niin johonkin tiettyyn tarkoitukseen, jotta se kantaa semanttisen kuorman Internet-resurssin käyttäjille.
Sosiaalisten ohjelmistojen tunnistepilvellä on kolme pääkäyttöä , jotka eroavat enemmän tarkoituksen kuin ulkonäön suhteen:
Ensimmäisessä tunnistepilvessä koko tarkoittaa sitä, kuinka monta kertaa tunniste on lisätty elementtiin [10] . Tämä on hyödyllinen tapa näyttää metatiedot kohteesta, josta on "äänestetty" useita kertoja, ja kun tarkkaa tietoa ei ole annettu. Esimerkkejä tästä käytöstä ovat Last.fm (määrittää yhtyeen musiikin genren) ja LibraryThing (määrittää kirjan avainsanoja).
Toisessa tyypissä koko vastaa niiden kohteiden määrää, joihin tunniste on kiinnitetty, mikä osoittaa tunnisteen suosion . Esimerkkejä tämän tyyppisestä tunnistepilvestä löytyy digitaalisten valokuvien tallennus- ja jakelusivustolta Flickr , RSS -kokooja Technorati ja kirjoittamalla Google -hakukyselyyn DeeperWeb .
Kolmas tyyppi käyttää tunnisteita tapana luokitella kohteet. Tunnisteet esitetään pilvessä, jossa suuret tagit edustavat kyseisen luokan kohteiden määrää.
Tunnisteklusterin rakentamiseen tunnistepilven sijasta on useita tapoja, kuten samaan aikaan esiintyvien tunnisteiden käyttäminen asiakirjoissa [11] .
Yleisemmin samaa visuaalista esitystä voidaan käyttää muiden kuin tunnisteiden [12] , kuten tunnistepilven tai tietopilvien, näyttämiseen.
Termiä avainsanapilvi käytetään joskus hakukonemarkkinointiterminä , jossa se viittaa verkkosivustoon liittyviin avainsanaryhmiin. Viime vuosina tunnistepilvet ovat tulleet suosituiksi, koska ne ovat tärkeitä verkkosivujen hakukonemarkkinoinnissa ja auttavat käyttäjiä navigoimaan verkkosivuilla tehokkaasti [13] . Tunnistepilvien avulla navigointikeinona voit linkittää verkkosivuston resursseja tiiviimmin [14] , tällaisten resurssien ohittaminen hakurobotin toimesta voi parantaa sivuston asemaa hakukonetuloksissa [15] . Käyttöliittymän näkökulmasta tunnistepilviä käytetään usein auttamaan käyttäjää löytämään tietoa tietystä järjestelmästä nopeammin tekemällä yhteenvedon hakutuloksista [16] .
Tunnistepilvet esitetään yleensä upotettuina HTML - elementteinä. Tunnisteet voidaan lajitella aakkosjärjestyksessä, satunnaisesti, painon jne. mukaan. Joskus muita visuaalisia ominaisuuksia, kuten väriä, kirkkautta tai leveyttä, muutetaan fontin koon lisäksi [17] . Yleisin esitys on suorakulmion muotoinen, jossa tunnisteet on järjestetty aakkosjärjestykseen ja näytetään rivi riviltä. Tunnisteen sijainnin valinta riveissä sopii käyttäjän tavoitteisiin. Joskus etusija annetaan semanttiselle tag-klusterille (merkityksessään samanlaiset tunnisteet näytetään vierekkäin) [18] [19] [20] . Heuristiikkaa voidaan käyttää tunnistepilven koon pienentämiseen riippumatta siitä, suoritetaanko klusterointi vai ei.
Datapilvi on dataa, joka käyttää eri fontin väriä ja/tai kokoa esittämään numeerista dataa [21] . Tietopilvet ovat samankaltaisia kuin tunnistepilvet [22] , mutta sanojen laskemisen sijaan näytetään tiedot, kuten väestötiheys tai pörssikurssit .
Tekstipilvi tai sanapilvi on visualisointi tekstissä olevien sanojen tiheydestä painotettuna luettelona [24] . Viime aikoina tätä tekniikkaa on käytetty poliittisten puheiden temaattisen sisällön visualisointiin [25] .
Tekstipilvien periaatteita kehittämällä sanapilvet antavat tekstille tai ladontalle tarkemman ilmeen . Koko tekstin sijaan lausepilvi keskittyy yksittäisten sanojen käyttöön. Tuloksena oleva pilvi sisältää sanoja, joita käytetään usein yhdessä alkuperäisen sanan kanssa. Nämä lauseet edustavat kirjasinkoon korostettua tiheyttä sekä kirkkauden korostaman linkin voimakkuutta. Tämän avulla voit oppia interaktiivisesti kieltä [26] .
Tunnistepilvien käytettävyyttä on tutkittu useissa tutkimuksissa. Seuraava luettelo perustuu Lohmannin et al.:n tutkimukseen:
Yleensä tunnisteen kirjasinkoko tunnistepilvessä määräytyy tunnisteen yleisyyden mukaan. Sanapilvessä, kuten blogiluokissa, taajuus vastaa kyseiseen kategoriaan määritettyjen blogitekstien määrää. Pienemmille taajuuksille voit määrittää kirjasinkoot suoraan yhdestä käytettyyn enimmäiskirjasinkokoon. Korkeammilla taajuuksilla skaalaus on tarpeen . Esimerkiksi käyttämällä lineaarista muunnosta tunnisteen paino skaalataan kertoimien asteikolla välillä 1 - f , jossa määritetään sallittujen painojen alue.
varten ; muuten
Koska laskettujen elementtien määrä tunnistetta kohden jakautuu yleensä eksponentiaalisen jakauman lain mukaan [29] , siksi suurille arvoalueille on järkevää käyttää logaritmista esitystapaa [30] .
Tunnistepilvitoteutus sisältää myös tarpeettomien tunnisteiden, kuten prepositioiden, pronominien, numeroiden ja välimerkkien, jäsentämisen ja suodattamisen.
On myös verkkosivustoja, jotka luovat keinotekoisia tai satunnaisesti jaettuja tunnistepilviä mainonta- tai humoristisia tarkoituksia varten.