SISSEJUHATUS ARVUTUSLINGVISTIKASSE
MTAT.06.012

Aine maht: 6 EAP
Loenguid 2 tundi nädalas
Praktikume 2 tundi nädalas
Õpetamise aeg: sügissemester
Hindamine: eksam
Eeldusained: ei ole

Sisu lühikirjeldus: Arvutuslingvistika kui informaatika ja lingvistika hübriidala põhimõisted ja põhiülesanded. Formaalsed grammatikad ja keeled, Chomsky hierarhia. Statistilised meetodid keele automaattöötlusel. Arvutuslingvistika rakendused.

Kirjandus:

  • Daniel Jurafsky & James H. Martin. An introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall, 2008, 2000
  • Igor A. Bolshakov and Alexander Gelbukh. COMPUTATIONAL LINGUISTICS. Models, Resources, Applications. IPN-UNAM-FCE, 2004.

  • Vt ka

  • loomuliku keele automattöötluse alased kursused maailmas.
  • Stanfordi ülikooli tasuta on-line kursus Natural Language Processing 2012 (C. Manning, D. Jurafsky)


  • Temaatiline kava

    1. Mis on arvutuslingvistika?
    2. Arvutuslingvistika põhiülesanded.
    3. Regulaaravaldised, regulaarsed keeled ja lõplikud automaadid.
    4. Formaalsed grammatikad ja keeled. Chomsky hierarhia.
    5. Arvutimorfoloogia.
    6. Arvutifonoloogia.
    7. Arvutisüntaks.
    8. Süntaksianalüüsi strateegiad.
    9. Pehmelt kontekstisidusad grammatikad ja keeled.
    10. Tunnused ja tunnuste struktuurid.
    11. Unifikatsioonigrammatikad.
    12. Keel ja keerukus.
    13. Statistilised meetodid. Mitmesuse lahendamine.
    14. Automaatne semantiline analüüs. Tähenduse esitamise formaalsed keeled.
    15. Seotud teksti analüüs.
    16. Dialoogi analüüs.
    17. Teksti genereerimine.


    2011./2012. õ.-a. sügissemester

    Loengud teisipäeviti kell 14.15-15.45 Liivi 2-403.
    Praktikumid paarisnädalatel neljapäeviti kell 16.15-20 arvutiklassis Liivi 2-004 (Siiri Pärkson).

    Vt ka moodle.ut.ee

    Kordamisküsimused

    Eksam