Spletna učilnica

infografika

Spodnjih sedem predmetov smatramo za temelje digitalnega jezikoslovja.

Naziv predmeta Rudarjenje in upravljanje večjezične terminologije
Predavateljica Špela Vintar
Opis predmeta Sistematično upravljanje terminologije je bistveno za učinkovito povezovanje specializiranih vsebin, bodisi v jezikovni industriji bodisi v poslovnem ali institucionalnem okolju. Predmet omogoča študentom razumevanje specializiranega diskurza in pregled teoretičnih temeljev, metod in orodij za upravljanje terminologije v večjezičnih kontekstih. Temeljna komponenta tega predmeta od študentov zahteva, da razvijejo veščine, potrebne za pripravo zbirke besedil, specifičnih za posamezna področja, in uporabo računalniških metod za pridobivanje specializiranih znanj iz takšnih zbirk.
Cilji predmeta
  • Prepoznati termine in njihove lastnosti v različnih komunikacijskih okoliščinah
  • Razumeti potrebe različnih uporabnikov terminologije
  • Načrtovanje, oblikovanje in izpolnjevanje terminološke baze v orodju za upravljanje terminologije po izbiri
  • Izdelati specializiran korpus besedil za potrebe terminološkega rudarjenja
  • Uporaba korpusne delovne plošče za pridobivanje eno- in večbesednih terminov, definicij in drugih ustreznih informacij v enem ali več jezikih
  • Preverjanje, vrednotenje in izvajanje rezultatov terminološkega rudarjenja
Teme predavanj
  • Osnovni pojmi v terminologiji
  • Pojmi, definicije in relacije
  • Termini na specializiranih področjih, v žanrih, jezikih
  • Upravljanje terminologije: strukturiranje vnosa, razpoložljiva orodja
  • Gradnja korpusa za rudarjenje terminov
  • Pristopi k rudarjenju terminov
  • Iskanje ključnih besed in terminov z vgrajeno terminološko slovnico
  • Pridobivanje terminov in definicij z naprednimi poizvedbami CQL
  • Rudarjenje večjezičnih terminov
  • Potrjevanje in ovrednotenje rezultatov
Raven Srednja
Način dela Interaktivne predstavitve, video in zaslonski zapisi, vaje, vodeno delo in naloge, branje in samostojno raziskovanje
Čas izvajanja 120 ur
ECTS 5
Naziv predmeta Lokalizacijska orodja in delovni procesi
Predavateljica Caroline Reiss
Opis predmeta Današnja lokalizacijska industrija se spopada z nalogo prevajanja ogromnega števila besedil za ustvarjanje visoko kakovostnih lokalizacijskih izdelkov v kratkem časovnem obdobju, da bi zadovoljila potrebe globalnih in lokalnih trgov. Takšen podvig bi bil nepojmljiv brez uporabe tehnologije in razvoja orodij za lokalizacijo, ki je bil v zadnjih desetletjih ključen in je sprožil spremembe v skupinskih sodelovanjih. Cilj predmeta je študente oskrbeti s kritičnim razumevanjem uporabe teh orodij, predvsem pa orodij za računalniško podprto prevajanje (CAT).
Cilji predmeta
  • Opis različnih vrst računalniških orodij, ki so na voljo za podporo procesa lokalizacije
  • Izkoristiti osnovne funkcionalnosti računalniško podprtih prevajalskih orodij
  • Združevanje prevajalskih orodij z drugimi računalniškimi orodji in viri za obdelavo jezikovnih podatkov
  • Določiti trenutne omejitve teh orodij
  • Prikazati zavest o ravni načrtovanja in upravljanja procesa lokalizacije
Teme predavanj
  • Zgodovinski razvoj lokalizacijske industrije
  • Ustvarjanje vsebine in lokalizacijski cikel
  • Nadzor jezika
  • Prevajalske tehnologije
  • Osnovni pojmi v programski opremi za pomnilnik prevodov
  • Življenjski cikel in upravljanje projekta lokalizacije
Raven Uvodna
Način dela Posnete predstavitve, interaktivne aktivnosti, kvizi, vodeno raziskovanje in projektni pristop k učenju o jezikovnih tehnologijah
Čas izvajanja 100 ur
ECTS 4
Naziv predmeta Računalniška leksikologija in leksikografija
Predavateljica Nives Mikelić Preradović
Opis predmeta Računalniška leksikologija se lahko opredeli kot uporaba računalnikov pri preučevanju leksikona. V najširšem smislu je to multidisciplinarno področje, ki vključuje analizo umetnih slovarjev na podlagi uporabe računalnikov za preučevanje njihovega strojno berljivega besedila ter preučevanje računalniške jezikovne vsebine in urejevanje leksikonov za uporabo v aplikacijah za obdelavo naravnega jezika. Predmet vključuje teoretične in praktične informacije o trenutnih procesih za sestavo slovarjev in leksikalnih podatkovnih baz, ki jih uporabljajo aplikacije za obdelavo naravnega jezika. Tema priprave slovarja z uporabo obdelave naravnega jezika je obravnavana z vidika računalniškega leksikografa. Obravnavana so tudi tehnična vprašanja sestave slovarja. Pri projektu bodo študenti raziskovali slovarske vnose v različnih računalniških leksikonih, ki so bili zgrajeni z uporabo opisanih orodij, podatkov in procesov.
Cilji predmeta
  • Razumeti vsebino in omejitve natisnjenih slovarjev za računalniške namene
  • Kritično primerjati oblikovanje, strukturo in vsebino različnih vrst enojezičnih in dvojezičnih subkategorizacijskih (valenčnih) leksikonov
  • Razložiti teoretične vidike in najpomembnejše metode gradnje subkategorizacijskih leksikonov
  • Izdelati valenčni vnos v dvojezičnem valenčnem leksikonu
  • Primerjati oblikovanje in vsebino različnih vrst sentimentnih leksikonov
  • Načrtovanje majhnega leksikografskega projekta in njegovo izvajanje z uporabo tehnik, obravnavanih na predavanjih
Teme predavanj  

  • Uvod v računalniško leksikologijo in leksikografijo
  • Elektronska leksikografija, računalniška in korpusna leksikografija
  • Morfološki leksikoni
  • Derivacijski in fleksijski morfološki leksikoni različnih evropskih jezikov
  • Leksikalni odnosi in leksikalne podatkovne baze
  • Wordnets za različne jezike EU
  • Subkategorizacijski leksikoni (valenčni)
  • Semantični leksikoni
  • Sentimentni leksikoni
  • Oblike, standardi in avtomatska pridobitev računalniških leksikonov
Raven Srednja
Način dela Interaktivne predstavitve, video in zaslonski zapisi, vaje, kvizi znanja, vodene raziskovalne naloge, vodeno branje
Čas izvajanja 120 ur
ECTS 5
Naziv predmeta Uvod v Python za jezikoslovce
Predavateljica Petra Bago
Opis predmeta Python je trenutno eden izmed najlažjih programskih jezikov. Predmet omogoča študentom razumevanje osnovnih pojmov programiranja s poudarkom na pridobivanju znanja in veščin, ki so potrebne za obdelavo besedila. Namenjen je študentom jezikoslovja in drugih disciplin brez predhodnih izkušenj programiranja, ki jih zanima učenje Pythona za obdelavo velike količine besedil.
Cilji predmeta
  • Razumevanje in izvajanje Pythonove sintakse in semantike
  • Identificirati, opisati in izvesti spremenljivke, operaterje in funkcije v Pythonu
  • Identificirati, opisati in izvesti cela števila, številk s plavajočo vejico, nizov, seznamov, datotek in slovarjev v Pythonu
  • Identificirati, opisati in izvesti nadzorni tok v Pythonu
  • Identificirati, opisati in izvesti ustaljenih izrazov v Pythonu
Teme predavanj
  • Uvod v Python
  • Osnovni podatkovni tipi
  • Spremenljivke
  • Osnovni operaterji
  • Osnovne funkcije
  • Delo z nizi
  • Delo s seznami
  • Nadzorni tok
  • Delo z datotekami
  • Osnovni ustaljeni izrazi
  • Delo s slovarji
Raven Uvodna
Način dela Interaktivne predstavitve, video in zaslonski zapisi, vaje, kvizi znanja, branje in naloge s povratno informacijo predavatelja o študentovi nalogi.
Čas izvajanja 120 ur
ECTS 5
Naziv predmeta Popravljanje strojnih prevodov
Predavateljici Jean Nitzke, Anke Tardel
Opis predmeta Ta predmet ponuja uvod v »post-editing« (proces, v katerem prevajalec popravi neobdelan strojni prevod). Predmet zajema teoretično ozadje in praktične vaje.
Cilji predmeta Spoznati, kako deluje strojno prevajanje

Razumeti, kaj popravljanje strojnih prevodov pomeni in kako se ga izvaja

Razlikovati med človeškim prevajanjem, popravljanjem in lektoriranjem

Oceniti dejavnike, ki vplivajo na proces popravljanja

Spoznati popravljanje trojnih prevodov v praksi in raziskovanju

Teme predavanj Zgodovina strojnega prevajanja

Pristopi k strojnem prevajanju

Osnovno popravljanje

Različni slogi popravljanja

Popravljanje in sistemi pomnilnika prevodov

Popravljanje in nadzorovani jeziki

Popravljanje v raziskovanju

Popravljanje v praksi

Raven Med uvodno in srednjo
Način dela Interaktivne predstavitve, avdio in video posnetki, vaje, kvizi znanja, branja
Čas izvajanja 120 ur
ECTS 5
Naziv predmeta Uvod v obdelavo in analizo besedila
Predavatelja Lucie Chlumská, Pavel Vondřička
Opis predmeta Glavni cilj predmeta je omogočiti študentom začetne ravni digitalne lingvistike vse potrebne informacije o obdelavi in analizi besedila. Pri predmetu začnemo z osnovnimi temami, kot so značilnosti navadnega besedila in razliko med podatki in metapodatki, in nadaljujemo z razlago lastnosti XML in različnih vrst anotiranje besedila, predstavljamo proces tokenizacije, segmentacije in morfološke analize, opisujemo meje in možnosti skladenjskega in semantičnega označevanja ter povzamemo načela CQL in korpusnih poizvedb vključno z uporabo ustaljenih izrazov in poizvedovanje vzporednih korpusov.
Cilji predmeta Razumeti, kako se računalniki spopadajo z besedilnimi podatki

Razlikovati med različnimi podatkovnimi formati in iz njih izvleči besedilno vsebino (npr. z uporabo OCR);

Razumeti lastnosti navadnega besedila in formatov XML

Razumeti načela in težave anotiranja besedila vključno z morfološko analizo, skladenjskim in semantičnim označevanjem

Spoznati razpoložljive vire za obdelavo in analizo besedila vključno z oznakami in konkordančniki

Analizirati obstoječe in lastne korpuse v različnih razpoložljivih korpusnih orodjih

Izgraditi kompleksne poizvedbe CQL vključno z ustaljenimi izrazi in logičnimi operatorji

Teme predavanj Datotečni formati, povezani z besedilnimi podatki

Navadno besedilo: kodiranje, podatki in metapodatki

Razširljiv označevalni jezik ali XML

Ustaljeni izrazi

Tokenizacija in formati korpusnih podatkov

Morfološka analiza: načela in orodja

Skladenjsko in semantično anotiranje

Raziskovanje in analiza korpusa

Povpraševanje po korpusnih podatkih s CQL

Poravnava besedila in vzporedni korpusi

Raven Uvodna
Način dela Interaktivne predstavitve, avdio in zaslonski posnetki, vaje, kvizi znanja, branja
Čas izvajanja 100 ur
ECTS 4
Naziv predmeta Variabilnost jezikov v času in prostoru
Predavateljice Anna Nedoluzhko, Magda Ševčíková, Šárka Zikánová
Opis predmeta Predmet omogoča študentom osnovne informacije o raznolikosti naravnih jezikov po svetu in glavnih dimenzijah, po katerih se razlikujejo.
Cilji predmeta Razumeti osnovne jezikovne pojme, ki so potrebni za analizo jezikovne variance na različnih ravneh opisa jezika

Razlikovati vrste jezikov po različnih tipoloških merilih, kot so morfologija in besedni red

Opredeliti glavne vrste pisnih sistemov

Razumeti glavna načela fonoloških, morfoloških in skladenjskih sprememb jezika z diahronega vidika

Analizirati posledice jezikovne raznolikosti za sodobno jezikovno tehnologijo

Teme predavanj Jeziki po svetu

Jezikovni znak, jezikovni sistem

Slovnica, leksikon in besedotvorje

Besedotvorje v različnih jezikih

Jezikovna tipologija slovnice: Morfologija

Jezikovna tipologija slovnice: Skladnja

Pisni sistemi po svetu

Jezikovna tipologija slovnice: Fonologija

Vpliv diahronih jezikovnih procesov na jezikovno spremenljivost

Diahrone spremembe jezikov

Raven Uvodna
Način dela Predstavitve in posnete predstavitve skupaj s priporočenim dodatnim branjem, z interaktivnimi kvizi in drugimi vrstami aktivnosti.
Čas izvajanja 80 ur
ECTS 3