Teksti genereerimine (süntees)

Vt. ka language generation, peatükk raamatust Survey of the State of the Art in Human Language Technology.
Natural Language Generation: an introduction and open-ended review of the state of the art, John A. Bateman (2002)
Daniel Jurafsky, James H. Martin, ptk 20 (2000.a väljaanne).
Veebiressursid vt ACL Special Interest Group on Generation (SIGGEN)

 

Keele genereerimine (süntees) oli arvutilingvistikas kaua aega teisejärguline.

Nii nagu teksti analüüs on enamat kui lause analüüs, on ka teksti süntees enamat kui lause süntees.

Analüüsi ülesanne on tõlkida loomulikust keelest tähenduse esitamise keelde (näiteks predikaatarvutus). Sünteesi ülesanne on pöördülesanne: tõlkimine tähenduse esitamise keelest loomulikku keelde.

Teksti genereerimisel on põhiprobleemideks teksti planeerimine, lausete planeerimine ja plaani teisendamine grammatiliselt korrektseks tekstiks.
Paljudes loomuliku keele süsteemides kasutatakse lihtsaimat lähenemisviisi: süsteem väljastab valmis lauseid (veateated, hoiatused).
Järgmine tase on lausemallide kasutamine (kui sama teadet tuleb produtseerida korduvalt, kuid väikeste muudatustega).
Täiuslikumad süsteemid kasutavad tunnustel põhinevat lähenemist, kus väljund ehitatakse üles lihtsatest tunnustest struktuuri moodustamise teel. Mitmes kohas, näiteks Saksamaa Tehisintellekti Uurimiskeskuses Saarbrückenis ja Columbia ülikoolis on teoksil projektid, kus rakendatakse multimeediumi vahendeid koos planeerimise ja keele genereerimisega.

Teksti genereerimise etapid

Lause süntees

Analüüsil 2 ülesannet: 1) sõnade kujutamine predikaatideks ja hulkade nimedeks ja 2) täpselt piiritletud loogiliste kvantorite koostamine. Analüüsil võib kasutada algoritmi: üks funktsioon analüüsib nimisõnafraase ja moodustab piiritletud kvantoreid, teine analüüsib lausestruktuure ja moodustab predikaate kvantoritega seotud argumentidega.

Samasuguse, kuid pööratud struktuuri võib üle võtta sünteesiks.

(k x Î {y Î G | P(y) } )

k - kvantor " , $ või i .
Näiteks
every young man (" xÎ {y Î men | young(y)})

Q1 Q2 ... Qn R(x1, x2, ..., xn)

Qi - kvantorid, R - predikaat

Asesõnade kasutamine. Aja, tegumoe jms. valik.

(Mitmelauselise seotud) teksti süntees


Genereerimissüsteemid maailmas
    Eesti keele genereerimine
    • Eestikeelse teksti genereerimise programmi (tolleaegsele EC-tüüpi arvutile, keeles PL/I) koostas esimesena Ülle Pettai oma diplomitöös1985.a. Programmi sisendiks on teksti freim ja väljundiks (mitmelauseline) eestikeelne seotud tekst.
    • Eestikeelse lause genereerimisega tegeleb ka Emilia Käsperi 2004.a kevadel valminud bakalaureusetöö "Eesti keele lausete automaatne genereerimine".
    • Masintõlge inglise-eesti. Vt http://www.keeletehnoloogia.ee/projektid/masintolge
    • Dialoogsüsteemides Reisiagent, Teatriagent, Kinoagent, Hambahaldjas kasutatakse valmis lauseid ja lausemalle.