Zavod za lingvistiku
Filozofski fakultet
Sveučilište u Zagrebu

Hrvatski
nacionalni
korpus


HOME

USTANOVE/UDRUGE

PROJEKTI

KORPUSI

RJEČNICI

ALATI

GOVOR

SKUPOVI/KONGRESI

POJMOVNIK

OSTALO

Jezičnotehnološki alati

Hrvatski alati


Ostali alati

Urednici i konvertori teksta

  • Emacs (u potpunosti programabilni urednik teksta)
  • 2XML (alat za konverziju iz HTML/RTF tekstova u XML)
  • Softleks (vrhunski specijalizirani urednik teksta za sastavljanje rječnika)

Obilježavanje jezičnih resursa

  • SGML (Standard Generalized Markup Language)
  • XML (Extended Markup Language)
  • TEI (Text Encoding Initiative: polazna stranica)
  • TEI preporuke za obilježavanje korpusa
  • TEI Pizza Chef (on-line definiranje DTD-ova)
  • CES (Corpus Encoding Standard, SMGL)
  • XCES (Corpus Encoding Standard, XML)
  • TMX specifikacija formata
  • XT (SGML/XML parser i validator Jamesa Clarka)
  • O'Reilly XML.com

Popisi riječi, čestotnici, konkordancije, tekstna statistika i analiza

Označivači teksta (taggers)

  • TNT (trigramski označivač)
  • WinBrill (označivač temeljen na pravilima, radi pod Windowsima)
  • QTAG (jezično neovisan označivač)
  • Češka morfologija (Johns Hopkins Univ.)
  • CLAWS (označivač kojim je označen Britanski nacionalni korpus)

Sintaktički parseri

Sintaktičke banke (tree-banks)

Semantičke mreže

Sravnjivanje (alignment)

Strojno (potpomognuto) prevođenje (Machine (aided) translation)

Razvojna okružja (Developers environment)