Razlika izmedu računalne lingvistike i strojne obradbe jezika. Tehnologija i jezične tehnologije (JT). Industrijalizacija jezika, razvitak pismenosti i (tele)komunikacija. Podjela JT: jezični resursi, jezični alati, komercijalni proizvodi. Razvitak JT za pojedini jezik. Primjeri uporabe JT: pretraživanje dokumenata, crpljenje obavijesti, prepoznavanje naziva... JT za hrvatski jezik: stanje, projekti, perspektive. JT resursi: korpusi, rječnici. JT alati na raznim jezičnim razinama: fonološkoj (n-grami pismena), morfološkoj (generatori, analizatori, lematizatori, označivači), sintaktičkoj (plitiki, duboki, robusni parseri, chunkeri, generativne i ovisnosne banke stabala), semantičkoj (FrameNet i WordNet). Komercijalni proizvodi: rječnici, provjernici (pravopisa, gramatike, stila), sustavi za diktiranje, strojno (potpomognuto) prevođenje (M(A)T) i računalno potpomognuto učenje jezika (CALL).
Razina studija: diplomski
ISVU šifra kolegija: 117625
Broj ECTS bodova: 5
Semestar: zimski