Mis on arvutuslingvistika?

Tagasi sisukorda  Järgmine teema

 

Arvutuslingvistika (AL), ka arvutilingvistika, kompuuterlingvistika, ingl. k. computational linguistics; saksa k. Computerlinguistik.

AL - interdistsiplinaarne teadusala lingvistika ja informaatika (e. arvutiteaduse) vahepeal, mille eesmärgiks on keele automaattöötluseks vajalike keele kirjeldus-, analüüsi- ja sünteesimeetodite väljatöötamine ja arvutitel realiseerimine.

(Vrd. H. Õim. Inimene, keel ja arvuti ehk kompuuterlingvistika. Tln, Valgus, 1983.)

Vt ka http://www.aclweb.org/archive/what.html - What is Computational Linguistics?

Arvutuslingvistika komponendid

Teoreetiline

Rakenduslik

teooriate püstitamine ja kontrollimine inimese keeleliste võimete kohta

tarkvara (arvutiprogrammide) koostamine keele (teksti ja kõne) automaattöötluseks

 

Näiteks:

  • masintõlge
  • keelelise info säilitamine ja automaatne otsimine (loomuliku keele tekste sisaldavad andmebaasid, vt. arvutileksikoloogia)
  • dialoog arvutiga loomulikus keeles (ekspertsüsteemidega, andmebaasidega)
  • kõneanalüüs, -süntees

Kõik need rakendused on seotud valdkonnaga, mida praegu nimetatakse keeletehnoloogiaks.

 

Arvutuslingvistika arengulugu

I

Masintõlge (MT)

1949 W. Weawer "Translation"

1954 1. MT eksperiment Georgetowni ülikoolis USA-s: arvuti IBM tõlkis 200-sõnalise teksti vene keelest inglise keelde

1966 ALPAC (Loomulike keelte automaattöötluse konsultatiivkomitee USA rahvusliku TA juures) aruanne: pessimism MT võimalikkuse suhtes

1950ndad

II

N. Chomsky generatiivsed grammatikad

1956 "Three models for the description of language"

1957 "Syntactic structures"

Transformatsioonigrammatika

Regulaarsed üritused: COLING alates 1965

Organisatsioonid: ACL 1968

1960ndad

III

Küsimus-vastussüsteemid

1972: T. Winograd SHRDLU (modelleeris roboti kätt "kuubikute maailmas", suhtlus inglise keeles); W. Woods LUNAR (Kuu kivimiproovide identifitseerimine, suhtlus inglise keeles)

Tihe seos tehisintellektiga!

Ekspertsüsteemid DENDRAL 1965, MYCIN 1976

Andmebaasid (liidesega loomulikus keeles); infootsisüsteemid

1970ndad

IV

Unifikatsioonigrammatikad

FUG (Functional Unification Grammar) M. Kay 1979

GPSG (Generalized Phrase Structure Grammar)

G. Gazdar 1970ndate II pool;

G. Gazdar & E. Klein & G. Pullum& I. Sag 1985

LFG (Lexical Functional Grammar)

R. Kaplan & J. Bresnan 1982

HPSG (Head driven Phrase Structure Grammar)

<= GPSG, LFG

C. Pollard 1984; C. Pollard & I. Sag 1987

Unifikatsioonigrammatikates kasutatakse lingvistiliste teadmiste esitamiseks nn. tunnuste struktuure (sõna iseloomustatakse grammatiliste tunnuste komplektiga), millele rakendatakse unifitseerimist (2 struktuuri asendatakse 3-nda, üldisema struktuuriga; sellest ka nimetus). Eesmärk: väike hulk (väga keerulisi) reegleid.

AL kui eriala hakati õpetama ülikoolides.

1980ndad

V

Keeletehnoloogia (language technology) - meetodite ja vahendite kompleks keele töötlemiseks tänapäeva elektrooniliste vahenditega.

Ka teoreetiline AL ei tule toime arvutiteta (keerulised formalismid).

1990ndad

 

AL ja teoreetiline lingvistika

AL keskendub kasulike rakenduste väljatöötamisele, teoreetiline lingvistika aga vaid grammatilisele kompetentsile: kuidas inimesed peavad ühtesid lauseid grammatiliselt õigeteks, teisi aga mitte.

 

AL kui inseneriteadus

Töökindla liidese loomine on raske ülesanne; üldiste tehnikate kasutamine võib seda lihtsustada:

 


Kasulikke viiteid:

  • Tartu Ülikooli arvutuslingvistika uurimisrühm
  • Keeletarkvarafirma Filosoft
  • Eesti Keele Instituut
  • TTÜ küberneetika instituudi foneetika ja kõnetehnoloogia labor
  • Zürichi ülikooli arvutuslingvistika instituut
  • Koblenz-Landau ülikooli arvutuslingvistika rühm
  • Arvutuslingvistika Saarimaa ülikoolis
  • Keeletehnoloogia Saksa Tehisintellekti Uurimiskeskuses
  • Keeletehnoloogia Manchesteri ülikooli teaduse ja tehnoloogia instituudis
  • FoLLI - Euroopa Loogika, Keele ja Informatsiooni Assotsiatsioon
  • ELSNET - Euroopa Keele ja Kõne Võrk
  • LDC - Lingvistiliste Andmete Konsortsium
  • ELRA - Euroopa Lingvistiliste Ressursside Assotsiatsioon
  • Elektrooniline ajakiri COLIBRI
  • Viited kontrollitud 04.02.04


    Tagasi peatüki algusesse