Teksti genereerimine (süntees)
Vt. ka language
generation, peatükk raamatust Survey of the State
of the Art in Human Language Technology.
Natural
Language Generation: an introduction and open-ended review of the state of
the art, John A. Bateman (2002)
Daniel Jurafsky,
James H. Martin, ptk 20 (2000.a väljaanne).
Veebiressursid vt ACL Special Interest Group on Generation (SIGGEN)
Keele genereerimine (süntees) oli arvutilingvistikas kaua aega teisejärguline.
Nii nagu teksti analüüs on enamat kui lause analüüs, on ka teksti süntees enamat kui lause süntees.
Analüüsi ülesanne on tõlkida loomulikust keelest tähenduse esitamise keelde (näiteks predikaatarvutus). Sünteesi ülesanne on pöördülesanne: tõlkimine tähenduse esitamise keelest loomulikku keelde.
Teksti genereerimisel on
põhiprobleemideks teksti planeerimine, lausete planeerimine ja plaani
teisendamine grammatiliselt korrektseks tekstiks.
Paljudes loomuliku keele süsteemides
kasutatakse lihtsaimat lähenemisviisi: süsteem väljastab valmis lauseid (veateated,
hoiatused).
Järgmine tase on lausemallide
kasutamine (kui
sama teadet tuleb produtseerida korduvalt, kuid väikeste muudatustega).
Täiuslikumad süsteemid kasutavad
tunnustel põhinevat lähenemist, kus väljund ehitatakse üles lihtsatest
tunnustest struktuuri moodustamise teel. Mitmes kohas, näiteks Saksamaa
Tehisintellekti Uurimiskeskuses Saarbrückenis ja Columbia ülikoolis on teoksil projektid, kus rakendatakse
multimeediumi vahendeid koos planeerimise ja keele genereerimisega.
Teksti genereerimise etapid
Lause süntees Analüüsil 2
ülesannet: 1) sõnade kujutamine predikaatideks ja hulkade nimedeks ja 2)
täpselt piiritletud loogiliste kvantorite koostamine. Analüüsil võib kasutada
algoritmi: üks funktsioon analüüsib nimisõnafraase ja moodustab piiritletud
kvantoreid, teine analüüsib lausestruktuure ja moodustab predikaate kvantoritega
seotud argumentidega. Samasuguse, kuid pööratud struktuuri
võib üle võtta sünteesiks. (k x Î {y Î G | P(y) } ) k - kvantor " , $ või i . Q1 Q2 ... Qn
R(x1, x2, ..., xn) Qi - kvantorid, R - predikaat Asesõnade kasutamine. Aja, tegumoe jms.
valik. (Mitmelauselise
seotud) teksti süntees
Näiteks
every young man (" xÎ {y Î men | young(y)})
Genereerimissüsteemid
maailmas
Eesti keele genereerimine