SISSEJUHATUS ARVUTUSLINGVISTIKASSE
MTAT.06.001

Maht: 32 tundi loenguid, 32 tundi praktikume, 56 tundi iseseisvat tööd
1 semester, lõpeb eksamiga
3 ainepunkti
Eeldusained: ei ole

Sisu lühikirjeldus: tutvustatakse arvutuslingvistika kui arvutiteaduse ja lingvistika hübriidala põhimõisteid, loomuliku keele automaattöötluse põhimõtteid ja viise.


Temaatiline kava
 
Teema Kirjandus 
1. Mis on arvutuslingvistika?  [2], lk. 1-9; [3], 15-60, 322-335; [5], 61-128.
2.  Arvutuslingvistika põhiülesanded. [1], lk. 1-20.
3.  Süntaksianalüüs. Formaalsed grammatikad ja keeled. Chomsky hierarhia. [2], 10-21; [4], 433-454.
4. Süntaksianalüüsi strateegiad. [1], 43-44, 47-53.
5. Transformatsioonilised grammatikad. [2], 34-47.
6. Transformatsioonilised süntaksianalüsaatorid.  [2], 47-55.
7. Laiendatud grammatikad ja analüsaatorid. [2], 56-73.
8. Programmeerimiskeel PROLOG. [2], 73-80.
9. Pehmelt kontekstitundlikud grammatikad ja keeled. [2], 80-81; [4], 533-551.
10. Tunnused ja tunnuste struktuurid. [1], 83-101.
11.  Unifikatsioonigrammatikad. [1], 109-120.
12. Statistilised meetodid. 
Mitmesuse lahendamine.
[1], 189-226.
13. Semantiline analüüs. Tähenduse esitamise formaalsed keeled. [2], 90-110. 
14. Mõned probleemid semantilisel analüüsil. [2], 111-123.
15. Seotud teksti analüüs. [2], 140-152.
16. Teksti süntees. [2], 159-171.

 

Kirjandus:

1. J. Allen. Natural Language Understanding. 2nd ed. The Benjamin/Cummings Publ. Comp., Inc., 1994.

2. R. Grishman. Computational Linguistics. Cambridge University Press, 1986.

3. W. J. Hutchins. Machine Translation: past, present, future. Ellis Horwood Limited. John Wiley&Sons, 1986.

4. B. H. Partee, A. ter Meulen, R. E. Wall. Mathematical Methods in Linguistics. Kluwer, 1990.

5. G. W. Smith. Computers and Human Language. Oxford University Press, 1991.


2003./2004. õ.-a. kevadsemester

Loengud esmaspäeviti kell 10.15-12 Lossi 3-307.
Praktikumid kolmapäeviti 14.15-16 arvutiklassis Lossi 3-403 (Liina Eskor).

Kodused ülesanded (kokku 9; iga õigesti lahendatud ülesanne annab 1 punkti; kohustuslik on lahendada 5 ülesannet vabal valikul)
Praktikumid (kokku 12; iga praktikum annab 3 punkti, kui ülesanded on ettenähtud tähtajaks õigesti lahendatud)

Kirjalik eksam (max 60 punkti)
Esmaspäeval, 17. mail kl 10.15-12 Lossi 3-307
Esmaspäeval, 14. juunil kl 9.00-11 Liivi 2-315
Hinnete matriklisse kandmine reedel, 18. juunil kell 8-10 Liivi 2-303.

Kordamisküsimused


Teisi kevadsemestri kursusi:
  • Matemaatika arvutuslingvistidele I
  • Keeletehnoloogia
  • Sissejuhatus korpuslingvistikasse
  • MTAT.06.027 XML-based document transformations

  •  

     
     
     
     
     

    Suvekool Empirical methods in natural language processing, 2 AP, Tartus 9.-15.augustil
     
    Parandused ja täiendused: mare.koit@ut.ee
    Loodud 1997, viimati muudetud 16.juunil 2004
    <== Keeletehnoloogia õppetool
    Avatud Eesti FondSelle kursuse ettevalmistamist toetas 
    Avatud Eesti Fond