Tekstigeneraattori

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 13. elokuuta 2018 tarkistetusta versiosta . vahvistus vaatii 21 muokkausta .

Tekstigeneraattori  on tietokoneohjelma, joka tuottaa tekstejä (slangia pienelle tytölle ), jotka ovat useimpien kielinormien kannalta oikeita , mutta pääsääntöisesti merkityksettömiä (jonka yhteydessä tällaisia ​​ohjelmia kutsutaan joskus "harhaluuloiksi". generaattorit", " skitsofasiageneraattorit ").

Joskus lukija on generoinut sellaisen ohjelmatekstin (esim. Markovin ketjua käyttäen ), että se saattaa antaa vaikutelman, että teksti on merkityksellinen, varsinkin jos siinä on aihe, jota lukija ei tunne. Jotkut ihmiset eivät esimerkiksi ymmärrä filosofiaa ja pitävät mitä tahansa filosofista tekstiä, joka sisältää suuren määrän tiettyjä termejä, hölynpölynä , joten he eivät voi määrittää ohjelman kirjoittaman pseudofilosofisen tekstin keinotekoista luonnetta.

On olemassa erilaisia ​​tekstigeneraattoreita, jotka eroavat ominaisuuksiltaan (jotkin niistä voivat esimerkiksi muodostaa uusia sanoja itsestään).

Jonathan Swift elokuvassa Gulliver's Travels parodioiessaan Raymond Lullin Ars magnaa kuvaili satiirisesti Lagadosta kotoisin olevaa konetta, joka loi tekstejä.

Generaattorityypit

Tekstin luominen täysin satunnaisista sanoista muodostamalla antaa roskatuloksen: ihmiselle merkityksetön ja tekstianalysaattoreiden helposti tunnistettavissa, joten sitä ei käytetä. Yleensä luominen perustuu manuaalisesti kirjoitettuihin mallilauseisiin.

Tapauksissa, joissa luodun tekstin merkitys ei ole tärkeä, se koostuu eri lähdetekstien lauseista tai lauseiden osista. Tätä menetelmää yhdessä mallien ja synonyymien kanssa käytetään chat- ja kommenttiroboteissa sosiaalisissa verkostoissa ja blogeissa. Tällaiset robotit kopioivat keskustelukumppanille muilta keskusteluilta tai sivustoilta tallennettuja lauseita. Kehittyneemmät chatbotit lajittelevat lauseita avainsanojen mukaan, joten heidän vastauksensa on lähempänä keskustelun aihetta.

Synonymisoijat ja lauseiden luominen malleista

Usein tekstigeneraattoreita yhdistetään synonyymiohjelmiin, jotka muuttavat sanat automaattisesti synonyymeiksi , jotta ne voidaan kirjoittaa uudelleen ja tehdä niistä ainutlaatuisia. Sanat, jotka on korvattava mallissa synonyymeillä, korvataan makroilla .

Mitä pidempi teksti, sitä enemmän havaittavissa luonnottomuus automaattisesti ehdotetuissa synonyymeissä. Siksi "made for people" -teksteissä ( MDL ) synonyymeja voidaan käyttää vain ainutlaatuisten lyhyiden tekstien luomiseen: otsikoita ja ankkureita avainsanoilla , kommenteilla ja kappaleilla. Synonyymeja käytetään menestyksekkäämmin englanniksi, jolla, toisin kuin venäjällä, on yksinkertainen morfologia .

Synonymisointityypit:

"Meshanka" tekstiä eri lähteistä

Oviaukot "lentää pois" hakutuloksista nopeasti heidän tekstiensä heikon laadun vuoksi. Siksi oviaukkotyöntekijät yrittävät luoda tekstiä mahdollisimman vähän. Sivun eri elementteihin syntyy satunnaisesti vain pieniä, merkitykseltään sopivia lauseita. Ja tekstin kappaleet jäsennetään kokonaisuudessaan saman aiheen muilta sivustoilta, ja ne mahdollisesti synonyymisoidaan tai käytetään "massia".

"Älykkäät" generaattorit

Monet yritykset kehittävät kehittyneempää teknologiaa. Syntaktisia rakenteita luovat puheen osat ja lauseiden jäsenet , sanakirjojen sanat luokitellaan semantiikan avulla ja korvaavat ne edelleen automaattisesti lauseiksi. Työn äärimmäisen monimutkaisuuden ja määrän, tämän kehityksen tekijänoikeuksien ja liikesalaisuuksien (tällaisten järjestelmien avulla on periaatteessa mahdollista luoda erittäin kannattavia kaupallisia projekteja) vuoksi emme kuitenkaan voi odottaa kommunikointirobottien ja käännösrobottien ilmestymistä. tulevina vuosina.

Sovellus

Tällä tietotekniikan kehitystasolla ei ole vapaasti saatavilla tekstigeneraattoreita, joilla olisi suhteellisen merkityksellistä tekstiä. Generaattorit, joilla on järjettömiä sanoja tai kaavalauseita, ovat kapea-alaisia.

Yhtä tekstigeneraattoreita voidaan kutsua Yandexin uusimmaksi uutuudeksi - Balaboba, joka pystyy täydentämään tietyn lauseen laadukkailla ja luettavissa olevilla lauseilla ja jopa kokonaisilla teksteillä.

Monet sivustot selittävät yksityiskohtaisesti, kuinka tämä palvelu toimii.

Verkkosivustojen kehittäminen ja optimointi

Tekstigeneraattoreita käytetään laajasti sivustojen kehittämisessä ja hakukoneoptimoinnissa : kokonaisten sivustojen otsikoiden, kuvausten ja sisällön luomiseen käyttämällä dorgeneja ( oviaukkogeneraattoreita ).

On olemassa suuria englanninkielisiä sivustoja, jotka ansaitsevat rahaa mainonnalla, joiden kaikkea sisältöä eivät kirjoita toimittajat, vaan robotit - artikkelit kirjoitetaan automaattisesti uudelleen muista lähteistä. Esimerkkejä tällaisista sivustoista: Demand Media ja Associated Content [1] . Venäjän kielellä, toisin kuin englannin kielellä, on monimutkainen morfologia, joten tällaisten uudelleenkirjoitusrobottien esiintyminen Runetissa on erittäin monimutkaista.

Tekstigeneraattorin avulla luodut ja hakukoneoptimointiin käytettävät materiaalit vaativat pakollista huolellista valintaa ainutlaatuisuuskriteerin mukaan.[ selventää ] Tämä valinta tehdään käyttämällä erikoisohjelmistoa, jolla on erilainen varmennusalgoritmi.

Virtuaaliset keskustelukumppanit

Virtuaaliset keskustelukumppanit ( chatbotit) ovat ohjelmia, jotka on suunniteltu jäljittelemään viestintää chat-huoneissa . Niitä käytetään laajalti roskapostin lähettämiseen sosiaalisissa verkostoissa (roskapostirobotit), samoin kuin automaattisina vastaajina, jotka voivat vastata moniin avainsanoihin eri tilanteissa.

Koska samaan aikaan henkilö ei näe keskustelukumppaniaan, hän voi saada vaikutelman, että hän vastaa elävän henkilön kanssa. Yksikään chatbot ei kuitenkaan ole vielä läpäissyt Turingin testiä , ja tekstigeneraattoreita käyttävät ohjelmat pitävät sitä vielä vaikeampana.

Joukkopropagandaa ja trollausta sosiaalisissa verkostoissa

Internet-propagandan ja ”kybersotien” kehittymisen yhteydessä botteja käytetään sosiaalisissa verkostoissa yleisen mielipiteen massiiviseen matkimiseen. Boteja luotaessa niiden nimet ja Internet-osoitteet luodaan automaattisesti, ja kun he vastaavat, kommentit, yleensä provosoivaa, propagandaa tai loukkaavaa sisältöä.

Suhteellisen laajalti venäjänkielisessä Internetissä tunnettu Rareguest-tekstigeneraattori, joka oli suunniteltu php - skriptin muodossa . Jonkin aikaa sitä käytettiin osana satiirista Internet-projektia "Gavgav Center", ja sitten siitä tuli laajalle levinnyt robotti live-lehtiin, blogeihin jne. Tässä on esimerkkejä tämän robotin samantyyppisten viestien peräkkäisestä luomisesta:

Kaikki viestisi ovat tyypillisiä väärien vihjailujen kliseejä, jotka pyrkivät saattamaan huonoon uskoon ja pilkata kaikki, jotka alkavat nähdä selvästi ja puhua avoimesti rikollishallinnon rikoksista. Totuus heidän epäinhimillisyydestään ja verisen Kremlin hallinnon fasistisesta olemuksesta pistää verisen Kremlin haamujen idioottien silmiin! Mielenkiintoinen piirre tällä foorumilla on, että putinistit harjoittavat pääasiassa tulvimista tai keskustelua persoonallisuuksista, ja tällaiset Venäjän ongelmien ansioista johtuvat aiheet pelkäävät helvettiä. Valehtelijassa on tarpeeksi tilaa, jossa sinun kaltaiset NKVD-fasistit voivat viettää aikaansa ilman, että heitä rasittaa totuus ja Stalin- putinismin analyysi. Siksi luulen, että te putinistit olette moraalisia rappeutuneita. Loppujen lopuksi tällaisia ​​"keskustelujen osallistujia" ei esiinny Kremlin ja Yastrzhembskyn hallitsemilla "tšetšeenien" valehtelijoilla. Puti-Put ja hänen verenhimoiset päivätyöläiset vastaavat kaikesta.

Nämä esimerkit osoittavat, että jopa keskustelunaiheisiin perehtynyt lukija voi ottaa robotin viestejä vastaan ​​todellisen elävän ihmisen viestejä, vaikkakin jokseenkin korotettuna. Robotti näissä viesteissä esitetään vain tyypillisen rakenteen avulla lauseiden rakentamiseen ja yhdistämiseen.

Julkaisijoiden vertaisarvioinnin laadun tarkistaminen

On tapauksia, joissa tekstigeneraattoreita on käytetty menestyksekkäästi vertaisarvioinnin huonon laadun (ja joskus täydellisen puutteen) havaitsemiseen tieteellisissä lehdissä . SCIgen - ohjelma on erityisen tunnettu tässä suhteessa .

Muistiinpanot

  1. Avainsanasisältögeneraattorit . Habrahabr (8. heinäkuuta 2010). Haettu 2. heinäkuuta 2015. Arkistoitu alkuperäisestä 3. heinäkuuta 2015.

Linkit