Tietojen yhdistäminen

Tietojen yhdistäminen on prosessi, jossa tietolähteitä yhdistetään johdonmukaisemman, tarkemman ja hyödyllisemmän tiedon tuottamiseksi kuin yhdestä lähteestä [1] .

Tietojen yhdistämisprosessit ryhmitellään usein matalaan, keskitasoon tai korkeaan yhdistämiseen riippuen käsittelyvaiheesta, jossa yhdistäminen suoritetaan [2] . Matalan tason datafuusio yhdistää jotkin raakadatalähteet tuottamaan muuta raakadataa. Yhdistettyjen tietojen on oltava informatiivisempia ja synteettisempiä kuin alkuperäiset tiedot.

Esimerkiksi tietojen kerääminen ja yhteenveto antureista tunnetaan (multi-sensor) datafuusiona ja se on osajoukko tiedon fuusiota .

Ihmiset esimerkkinä tietojen yhdistämisestä

Ihmiset ovat suora esimerkki tiedon yhdistämisestä. Ihmisinä luotamme laajalti aisteihimme, kuten näkö-, haju- , maku-, ääni- ja fyysiseen liikkeeseen. Kaikkien näiden aistien yhdistelmä yhdistyy jatkuvasti auttamaan meitä suorittamaan useimmat, ellei kaikki, päivittäisen elämämme tehtävistä. Tämä on siis suora esimerkki tiedon yhdistämisestä. Luotamme ruoan tuoksun, maun ja kosketuksen yhdistelmään varmistaaksemme, että se on syötävä. Samoin luotamme näköomme ja kykyymme kuulla ja hallita kehomme liikkeitä kävellä tai ajaa autoa ja suorittaaksemme suurimman osan elämästämme. Kaikissa näissä tapauksissa aivot sulautuvat yhteen ja hallitsevat sitä, mitä meidän on tehtävä seuraavalla hetkellä. Aivomme luottavat yllä olevista aisteista kerättyjen tietojen fuusioon [3] .

Geospatiaaliset sovellukset

Tutkimuksen geospatial-alueella ( GIS ) tietojen yhdistäminen on usein synonyymi tiedon integroinnille . Näissä sovelluksissa on usein tarve yhdistää eri tietojoukot yhdistetyksi tietojoukoksi, joka sisältää kaikki datapisteet. Yhdistetyt tietojoukot eroavat yksinkertaisesta liittämisestä siinä, että yhdistetyn tietojoukon pisteet sisältävät attribuutteja ja metatietoja , joita alkuperäisen tietojoukon pisteillä ei välttämättä ole.

Alla on yksinkertaistettu esimerkki tästä prosessista, jossa tietojoukko α yhdistetään tietojoukkoon β muodostaen yhdistetyn tietojoukon δ. Joukon α datapisteillä on X- ja Y-tilakoordinaatit sekä A1- ja A2-attribuutit. Tietopisteillä joukossa β on X- ja Y-tilakoordinaatit sekä B1- ja B2-attribuutit. Yhdistetty tietojoukko sisältää kaikki pisteet ja attribuutit.

Syötä tietojoukko α

Syötä tietojoukko β

Yhdistetty tietojoukko δ

Piste	X	Y	A1	A2
α1	kymmenen	kymmenen	M	N
α2	kymmenen	kolmekymmentä	M	N
α3	kolmekymmentä	kymmenen	M	N
α4	kolmekymmentä	kolmekymmentä	M	N

Piste	X	Y	B1	B2
β1	kaksikymmentä	kaksikymmentä	K	R
β2	kaksikymmentä	40	K	R
β3	40	kaksikymmentä	K	R
β4	40	40	K	R

Piste	X	Y	A1	A2	B1	B2
δ1	kymmenen	kymmenen	M	N	K?	R?
δ2	kymmenen	kolmekymmentä	M	N	K?	R?
δ3	kolmekymmentä	kymmenen	M	N	K?	R?
δ4	kolmekymmentä	kolmekymmentä	M	N	K?	R?
δ5	kaksikymmentä	kaksikymmentä	M?	N?	K	R
δ6	kaksikymmentä	40	M?	N?	K	R
δ7	40	kaksikymmentä	M?	N?	K	R
δ8	40	40	M?	N?	K	R

Yksinkertaisessa tapauksessa, kun kaikki attribuutit ovat yhdenmukaisia koko alueella, attribuutit voidaan määrittää yksinkertaisesti: M?, N?, Q?, R? M, N, Q, R. Varsinaisissa sovelluksissa attribuutit eivät ole yhtenäisiä ja yleensä tarvitaan jonkinlainen interpolointi, jotta attribuutit voidaan määrittää oikein yhdistetyn joukon tietopisteille.

Paljon monimutkaisemmassa sovelluksessa merieläintutkijat ovat käyttäneet eläinten liiketietojen fuusiota syvyysmittaisten ja meteorologisten tietojen, merenpinnan lämpötilan eläinten elinympäristön kanssa nähdäkseen ja ymmärtääkseen eläinten käyttäytymistä vasteena ulkoisille vaikutuksille, kuten säälle ja veden lämpötilalle. Jokainen näistä tietojoukoista edustaa erilaista spatiaalista ruudukkoa ja näytteenottotaajuutta, joten yksinkertainen tietojen yhdistelmä antaisi todennäköisesti kohtuuttomia oletuksia ja sotkee analyysin. Yhdistämällä tiedot kuitenkin kootaan kaikki tiedot ja attribuutit yhdeksi kokonaisuudeksi, mikä luo täydellisemmän kuvan ympäristöstä. Tämä antaa tutkijoille mahdollisuuden paikantaa tärkeimmät paikat ja ajat ja antaa uusia näkemyksiä ympäristön ja eläinten käyttäytymisen välisestä vuorovaikutuksesta.

Oikealla olevassa kuvassa hummereita tutkitaan Tasmanmeren rannoilla. Hugh Pederson Tasmanyn yliopistosta käytti tietojen fuusio-ohjelmia yhdistääkseen eteläisen hummerin liikkeenseurantatiedot koodattu keltaisella ja mustalla päivällä ja yöllä kuvassa) syvyys- ja elinympäristötietojen kanssa yhdeksi 4-ulotteiseksi hummerien käyttäytymismalliksi.

Tietojen integrointi

Geospatiaalisten toimialueiden ulkopuolisissa sovelluksissa termien dataintegraatio ja tiedon yhdistäminen eroavat toisistaan. Esimerkiksi liiketoimintatiedon kaltaisilla aloilla termiä "datan integrointi" käytetään kuvaamaan tietojen yhdistelmää, kun taas termi "datafuusio" on integrointi, jota seuraa tiivistäminen ja tietojen korvaaminen. Tietojen integrointia voidaan pitää joukkoyhdistelmänä, jossa säilytetään suurempi joukko, kun taas fuusio on joukon vähentämistekniikka, jolla on parannettu luotettavuus.

JDL/DFIG malli

1980-luvun puolivälissä Joint Directors of Laboratories (JDL) muodostivat Data Fusion -alikomitean (josta tuli myöhemmin nimellä Data Fusion Group , DFG) . World Wide Webin myötä datafuusio alkoi sisältää anturifuusiota ja tiedon fuusiota. JDL/DFIG-ryhmä on ottanut käyttöön datafuusiomallin, joka on jaettu eri prosesseihin. Data Fusion Information Group ( DFIG ) -mallissa on tällä hetkellä kuusi tasoa :

Taso 0: Lähteen esikäsittely / aiheen arviointi

Taso 1 : Kohteen arviointi _

Taso 2 : Tilannearviointi _ _

Taso 3 : Vaikutusten arviointi ( tai uhan tarkentaminen ) _

Taso 4 : Prosessin tarkentaminen _

Taso 5 : Käyttäjän tarkennus tai kognitiivinen tarkennus _ _ _

Vaikka JDL-malli (tasot 1–4) on edelleen käytössä, sitä kritisoidaan usein siitä, että tasot on toteutettava määritellyssä järjestyksessä ja että se ei edusta riittävästi ihmisen osallistumista. DFIG-malli (tasot 0–5) ottaa huomioon ympäristötietoisuuden, käyttäjien tehostamisen ja työnhallinnan vaikutukset [4] . Puutteistaan huolimatta JDL/DFIG-mallit ovat hyödyllisiä tietojen fuusion prosessin visualisoinnissa, mikä edistää keskustelua ja yhteisymmärrystä [5] ja ovat tärkeitä myös tietofuusion kehittämisessä järjestelmätasolla [4] .

Sovellukset

Erilaisista liikenneantureista tiellä

Tietoa eri anturitekniikoista voidaan älykkäästi yhdistää liikenteen tarkan tilan määrittämiseksi. Tiestä johdettua akustista, kuva- ja anturidataa käyttävä datafuusiomenetelmä osoittaa erilaisten yksittäisten menetelmien yhdistämisen edut [6] .

Ratkaisujen yhdistäminen

Monissa tapauksissa maantieteellisesti hajallaan olevien antureiden tehonkulutus ja suoritusteho ovat erittäin rajallisia. Siksi tiettyyn ilmiöön liittyvä raakadata pienennetään usein useisiin bitteihin jokaista anturia kohti. Päätettäessä binääritapahtumaa (eli tai ), äärimmäisessä tapauksessa vain binääriratkaisu lähetetään anturista päätösvarauskeskukseen ja yhdistetään parannetun luokituksen saamiseksi [7] [8] [9] . ${\mathcal {H}}_{0}$ ${\mathcal {H}}_{1}$

Kontekstitietoisuuden parantamiseksi

Suuri määrä sisäänrakennettuja antureita, mukaan lukien liikeanturit, ympäristöanturit ja sijaintianturit, modernit mobiililaitteet mahdollistavat tyypillisesti mobiilisovellusten pääsyn suureen määrään anturitietoja, joita voidaan käyttää kontekstuaalisen tietoisuuden parantamiseen. Signaalinkäsittely- ja datafuusiotekniikoiden, kuten ominaisuuksien luomisen, toteutettavuusarvioinnin ja pääkomponenttianalyysin käyttäminen tällaisten anturitietojen analysoinnissa parantaa merkittävästi liikkeen luokittelua ja laitteen kontekstuaalista tilaa [10] .

Muistiinpanot

↑ Haghighat, Abdel-Mottaleb, Alhalabi, 2016 , s. 1984-1996.
↑ Klein, 2004 , s. 51.
↑ Penn State WebAccess Secure Login: (eng.) . ieeexplore-ieee-org.ezaccess.libraries.psu.edu . Haettu: 27.6.2018.
↑ 1 2 Blasch, Bosse, Lambert, 2012 .
↑ Liggins, Hall, Llinas, 2008 .
↑ Joshi, Rajamani, Takayuki, Prathapaneni, Subramaniam, 2013 .
↑ Ciuonzo, Papa, Romano, Salvo Rossi, Willett, 2013 , s. 861–864.
↑ Ciuonzo, Salvo Rossi, 2014 , s. 208–212.
↑ Ciuonzo, De Maio, Salvo Rossi, 2015 , s. 1249–1253.
↑ Guiry, van de Ven, Nelson, 2014 , s. 5687–5701.

Kirjallisuus

Lainaukset

Haghighat M., Abdel-Mottaleb M., Alhalabi W. Diskriminanttikorrelaatioanalyysi : reaaliaikainen ominaisuustason fuusio multimodaaliseen biometriseen tunnistamiseen // IEEE Transactions on Information Forensics and Security. - 2016. - T. 11 , nro 9 .
Lawrence A. Klein. Anturi ja datafuusio: Työkalu tiedon arviointiin ja päätöksentekoon . - SPIE Press, 2004. - ISBN 0-8194-5435-4 .
Erik P. Blasch, Éloi Bosse, Dale A. Lambert. Korkean tason tietofuusiohallinta ja järjestelmäsuunnittelu. — Norwood, MA: Artech House Publishers, 2012.
Martin E. Liggins, David L. Hall, James Llinas. Multisensor Data Fusion, toinen painos: teoria ja käytäntö (Multisensor Data Fusion). – CRC, 2008.
Joshi V., Rajamani N., Takayuki K., Prathapaneni N., Subramaniam LV Information Fusion Based Learning for Frugal Traffic State Sensing // Proceedings of the Twenty-Third International Joint Conference on Artificial Intelligence. – 2013.
Ciuonzo D., Papa G., Romano G., Salvo Rossi P., Willett P. One-Bit Decentralized Detection With a Rao Test for Multisensor Fusion // IEEE Signal Processing Letters. - 2013. - T. 20 , nro 9 . — ISSN 1070-9908 . - doi : 10.1109/LSP.2013.2271847 . - . - arXiv : 1306.6141 .
Ciuonzo D., Salvo Rossi P. Päätösfuusio tuntemattoman anturin havaitsemisen todennäköisyyden kanssa // IEEE Signal Processing Letters. - 2014. - T. 21 , nro 2 . — ISSN 1070-9908 . - doi : 10.1109/LSP.2013.2295054 . — . - arXiv : 1312.2227 .
Ciuonzo D., De Maio A., Salvo Rossi P. Systemaattinen kehys itsenäisten Bernoulli-kokeiden komposiittihypoteesitestaukseen // IEEE Signal Processing Letters. - 2015. - T. 22 , nro 9 . — ISSN 1070-9908 . - doi : 10.1109/LSP.2015.2395811 . - .
John J. Guiry, Pepijn van de Ven, John Nelson. Multi-Sensor Fusion parantaa kontekstuaalista tietoisuutta jokapäiväisistä toiminnoista kaikkialla läsnä olevilla laitteilla // Anturit. - 2014. - T. 14 , nro 3 . — S. 5687–5701 . - doi : 10.3390/s140305687 . — PMID 24662406 .

Lähteet

Dave L. Hall, James Llinas. Johdatus Multisensor Data Fusioniin // Proceedings of IEEE. - 1997. - T. 85 , nro 1 . - S. 6-23 .
Erik Blasch, Ivan Kadar, John Salerno, Mieczyslaw M. Kokar, Subrata Das, Gerald M. Powell, Daniel D. Corkill, Enrique H. Ruspini. Tilanteen arvioinnin ongelmat ja haasteet (taso 2 Fusion) // Journal of Advances in Information Fusion. - 2006. - T. 1 . Arkistoitu alkuperäisestä 27. toukokuuta 2015.
David L. Hall, Sonya A. H. McMullen. Matemaattiset tekniikat Multisensor Data Fusionissa, toinen painos. — Norwood, MA: Artech House, Inc., 2004. — ISBN 1-5805-3335-3 .
Mitchell HB Multi-sensor Data Fusion – Johdanto. – Berliini: Springer-Verlag, 2007.
Das S. High-Level Data Fusion. — Norwood, MA: Artech House Publishers, 2008.

Linkit

Data

Tietojen analysointi
Tietojen arkeologia
Tietojen puhdistus
Tiedonkeruu
Tietojen pakkaus
Tietojen korruptio
Tietojen kuratointi
Tietojen heikkeneminen
tietojen muokkaus
dataviljely
Tietomuodon hallinta
Tietojen yhdistäminen
Tietojen integrointi
Tietojen eheys
Datakirjasto
Tietojen menetys
Tiedonhallinta
Tiedonsiirto
tiedon louhinta
Tietojen esikäsittely
Tallennetaan tietoja
Tietojen yksityisyys
Tietojen palautus
Tietojen tiivistäminen
Tietovarasto
Tietojen laatu
datatiede
kaavinta
Tietojen puhdistus
Datan suojelu
data-analyytikko
Muistilaite
Tietojen validointi
Tietovarasto
Ensisijainen tietojenkäsittely

↑ Haghighat, Abdel-Mottaleb, Alhalabi, 2016 , s. 1984-1996.