Pretraga

Za pretragu HNK-a potreban klijentski program za pristup i pretraživanje korpusa Bonito.

Instalacija Bonita

Nakon preuzimanja Bonita za odgovarajući operacijski sustav (Windows, Linux/Unix/MacOs) sa njegovih službenih stranica (http://www.textforge.cz/download) potrebno ga je instalirati. Pod Windowsima treba raspakirati preuzetu ZIP datoteku u npr. c:\Program Files\Bonito, napraviti prečac na radnome stolu i pokrenuti ga. Za pokretanje pod Linuxom/MacOs-om potrebno je prethodno imati instaliran Tcl/Tk inačice 8.2 ili više.

Podešavanje Bonita

Pri prvom pokretanju Bonita, potrebno je podesiti parametre pristupa i korisničkih postavki.

Podešavanje parametara pristupa

Do podešavanja parametara pristupa dolazi se kroz izbornik Manager -> Connection:

Za vrijeme probnoga rada HNK-a v 2.0 korisničko ime će biti gost, a zaporku valja ostaviti praznom. Ukoliko je vaše računalo spojeno na Internet, pritiskom na OK priključujete se na poslužitelj HNK-a (u gornjem desnom kutu prozora otvorit će gumb s imenom polaznoga potkorpusa) i možete početi s radom.

Korisničke postavke

Do podešavanje korisničkih postavki dolazi se kroz izbornik Manager -> Options:

Ukoliko se želi zapamtiti postavke samo za vrijeme trenutačnoga odvijanja programa, onda treba potvrditi promjenu postavki pritiskom na Apply. Potvrdom na Save postavke se pamte za svako sljedeće pokretanje programa. Kad se ponovno pokrene Bonito, postavke će biti primijenjene.

Odabir korpusa

Prije pokretanja pretrage potrebno je odabrati željeni korpus ili potkorpus pritiskom na gumb u gornjem desnom kutu glavnoga prozora:

Jednostavne pretrage

Ulazni kriterij za pretragu tj. pronalaženje stožernice i dobivanje njezine konkordancije unosi se u redak New query na vrhu glavnoga prozora:

Otvaranjem strjelice na kraju unosnoga retka, dobiva se popis svih prošlih pretraga tako da ih nije potrebno nanovo utipkavati.

Primjeri jednostavnih pretraga:

Složene pretrage

Pretrage s regularnim izrazima

Tablica s primjerima uporabe osnovnih regularnih izraza


Izraz Opis Primjer Očekivani rezultati
. točka
zamjenjuje bilo koje pojedinačno pisme
glav. glava, glave, glavu
* zvjezdica
zamjenjuje nijedno, jedno ili više prethodnih pismena
glav* glav, glavv, glavvv, glavvvv, glavvvvv,...
+ plus
zamjenjuje jedno ili više prethodnih pismena
glav+ glavv, glavvv, glavvvv...
{x} vitičaste zagrade
označavaju broj traženoga ponavljanja prethodnoga pismena
glav.{3} glavama, glavica, glavicu, glavice, glavici, glavara, glavare, glavari...
{x,y} raspon u vitičastim zagradama
označava raspon dopuštenih ponavljanja prethodnoga pismena
glav{1,4}
.{5,10}
glav, glavv, glavvv, glavvvv
svi nizovi duljine između 5 i 10 pismena
| okomita crta
označava logičku operaciju ili
glava|ruka glava, ruka
[ ] uglate zagrade
označuju skup ili raspon pismena
iz kojeg je moguće birati
razrješenja postave
glav[aeiou]
[g-k]lava
glava, glave, glavi, glavo, glavu
glava, hlava, ilava, jlava, klava
( ) oble zagrade
služe za grupiranje izraza
(G|g)lava
([Gg]|[Pp])lava
Glava, glava
Glava, glava, Plava, plava
(?i) ovaj izraz služi za zanemarivanje razlike između velikih i malih slova (?i)glava Glava, glava

Ukoliko se u upitu želi upotrijebiti točka ., plus +, zvjezdica *, oble ( ), vitičaste { } ili uglate [ ] zagrade, svakome od tih pismena mora prethoditi \ čime se ta pismena tumače doslovno, a ne kao dio metajezika regularnih izraza.

Pretrage sa strukturnim oznakama u tekstu

Popis u korpusu uporabljenih strukturnih oznaka dostupan je kroz izbornik Corpus -> Information summary ili pokratom (ctrl+I):

Pretrage s lemom ili gramatičkim kategorijama

Napomena: Ovakva vrsta pretrage bit će dostupna za čitav HNK tek u HNK v 2.5 najavljenom za proljeće 2006. Za sada je to moguće isprobavati jedino na cw2000 potkorpusu.

Za objašnjenje i točan opis kratica za gramatičke kategorije tj. morfosintaktičkih oznaka (MSD-ova) pogledati na službene stranice MulTextEast preporuka.

Popis u korpusu uporabljenih naziva za atribute pojavnica (lema, gramatičke kategorije itd.) dostupan je kroz izbornik Corpus -> Information summary ili pokratom (ctrl+I) (vidi sliku iznad).

Prikaz dodatnih obavijesti u konkordancijama

U konkordancijama je moguće osim samoga teksta prikazati i kraticu izvornika, atribute pojavnice, strukturne oznake.

Prikaz kratice izvornika

Do prikaza kratice izvornika dolazi se kroz izbornik View -> References ili pokratom F4.

U HNK-u izvornik je kodiran referencijom na doc.file tako da treba odabrati tu ponuđenu referenciju. Kratica izvornika bit će prikazana na početku svakoga konkordancijskoga retka u zelenoj boji.

Prikaz atributa pojavnice

Do prikaza atributa pojavnica dolazi se kroz izbornik View -> Attributes ili pokratom F5.

U HNK-u atributi su kodirani nazivima lemma za leme i msd za gramatičke kategorije. Odabirom željenih atributa oni se prikazuju samo uz stožernicu (Only in KWIC) ili uza sve pojavnice u konkordanciji (For all positions).

Prikaz strukturnih oznaka

Do prikaza strukturnih oznaka dolazi se kroz izbornik View -> Structures ili pokratom F6.

Za odabir su ponuđene sve u korpusu uporabljene strukturne oznake, a u konkordanciji su prikazane zelenom bojom.

Ispisivanje i spremanje konkordancije

Konkordancije je moguće ispisati na papir (Concordance -> Print) ili spremiti u datoteku (Concordance -> Save to file ili pokrata F2). Ukoliko ispisujete na pisač, valja znati da Bonito automatski odabire polazni pisač i sve njegove polazne vrijednosti bez mogućnosti njihova podešavanja (ovisno o veličini postavljene konkordancijske okoline, to često mora biti pisač i papir veličine A3). Stoga postoji mogućnost spremanja konkordancije u datoteku i njezina otvaranja i preoblikovanja u nekom drugom programu.

Pri spremanju u datoteku, preporučljivo je odabrati utf-8 kodiranje pismena jer se time omogućuje potpuno očuvanje različitih pismovnih skupova. To univerzalno kodiranje danas mogu otvarati gotovo svi programi za uređivanje teksta.

Dokumentacija uz Bonito

Dodatne mogućnosti programa Bonito možete pregledati u njegovu priručniku koji se u HTML obliku poziva kroz izbornik Help -> Documentation. Također je dostupan priručnik i u PDF obliku u podmapi doc mape u koju je Bonito instaliran (npr. c:\Program Files\Bonito\doc).