Arvuti- ja korpuslingvistika termineid

Mati Erelt

Eestikeelne

Ingliskeelne

(teksti)päis

header

Alt- üles-analüüs, ülenev analüüs

Bottom-up parsing

Allkorpus

Subcorpus

Arvutileksikoloogia, raalleksikoloogia

Computational lexicology

arvutilingvistika, arvutuslingvistika, raallingvistika

Computational linguistics

Arvutisõnastik, raalsõnastik

Machine readable dictionary

Freim, raam

Frame

Freimisemantika

Frame semantics

Funktsionaalne unifikatsioonigrammatika

Functional unification grammar, FGU

Generatiivgrammatika

Generative grammar

grammatikakorrektor

Grammar checker

Indekseeritud grammatika (keel)

Indexed grammar (language), IG, IL

Infootsing

Information retrieval

joondamine

alignment

Kaartanalüüs

Chart parsing

Kategoriaalne grammatika

Categorial grammar, CG

Keele arvutiõpe

CALL=Computer-assisted (või computer-aided) language learning

Keeleressursid

Language resources, linguistic resources

keeleressursid

Language/linguistic resources

Keeletehnoloogia

Language technology, language engineering, linguistic engineering

Kollokatsioon, koosesinemine

collocation

Kõne mõistmine

Speech understanding

Kõneanalüüs

Speech analysis

kõnekorpus

Speech corpus

Kõnelejatuvastus

Speaker recognition

Kõnesüntees

Speech synthesis

Kõne-tekst muundus

Speech-to-text conversion, STT conversion

Kõnetuvastus

Speech recognition

Konkordants (sõna koos kontekstiga)

concordance

Kontekstisidus grammatika (keel)

Context sensitive grammar (language), CSG, CSL

Kontekstivaba grammatika (keel)

Context free grammar (language), CFG, CFL

Korpus, arvutikorpus, raalkorpus

Machine readable corpus, corpus

Korpuse märgendamine

Corpus annotation

Korpuslingvistika

Corpus linguistics

Laiendatud üleminekuvõrgustik

Augmented transition network, ATN

Leksikaalne andmebaas

Lexical data base

Leksikaalne kirje

Lexical entry

Leksikaalne teadmusbaas

Lexical knowledge base

lemmatiseerimine

lemmatisation

Liides

(Man-machine) interface

Loogiline vorm

Logical form

märgend

tag

Märgendaja

Tagger

Märgendamata tekst

Raw text

märgendisüstemm

tagset

märgendus

Annotation, tagging, encoding

Markovi peitmudel

Hidden Markov model, HMM

Masintõlge, raaltõlge

Machine translation

Mitmekeelne korpus

Multilingual corpus

monitorkorpus

Monitor corpus

Morfoloogiline märgendaja

Part-of-speech tagger, morphological tagger

morfoloogiline märgendamine

POS (part of speech) tagging, morphological tagging

Nõrgalt kontekstisidus grammatika (keel)

Mildly context sensitive grammar (language)

Osaline süntaksianalüüs

Skeleton parsing

Paralleelkorpus

Parallel corpus

päringuvahend

Query(ing) tool

Põhjakeskne fraasistruktuurigrammatika

Head driven phrase structure grammar, HPSG

Puude pank, süntaktiliselt märgendatud korpus

Treebank

Puutäiendamisgrammatika

Tree adjoining grammar, TAG

Regulaarne grammatika (keel)

Regular grammar (language)

Rekursiivne üleminekuvõrgustik

Recursive transition network, RTN

Saak? Took/saagikus/katvus/täielikkus/korrektsus

recall

Sama märgend, sama märgendi kasutus

Ditto tag, ditto tagging

Semantiline võrgustik

Semantic network

Sõltuvus-sidumisteooria

Government-binding theory

sõne

Running word

Speller, õigekirjakorrektor

Spelling checker, spellchecker, speller

Spetsiaalkorpus, erikorpus

Special corpus

Süntaksianalüsaator, parser

Parser, syntactic analyser

Süntaksianalüüs, süntaktiline analüüs

Parsing, syntactic analysis

Suulise keele korpus

Spoken language corpus

Täielik süntaksianalüüs

Full parsing

täpsus

precision

Tasakaalustatud korpus

Balanced corpus

Tekstiarhiiv

Text archive

Tekst-kõne muundus

Text-to-speech conversion

Tekstoteek

Electronic text library

Tipust-alla-analüüs, alanev analüüs

Top-down parsing

Tõlkemälu

Translation memory

Transformatsioon

Transformation

Transformatsioonigrammatika

Transformational grammar

Tunnus, tunnusjoon

Feature

Ühestamine

Disambiguation

Üldistatud fraasistruktuurigrammatika

Generalized phrase structure grammar, GPSG

Üleminekuvõrk

Transition network

Unifikatsioonigrammatika

Unification grammar