Publications

Chronological list of publications relevant for HNK by researchers from Institute of Linguistics. This publications were mainly made within several projects from the fields of computational linguistics and corpus linguistics:

Books

  1. Moguš, Milan; Bratanić, Maja; Tadić, Marko (1999) Hrvatski čestotni rječnik, Školska knjiga-Zavod za lingvistiku Filozofskoga fakulteta Sveučilišta u Zagrebu, Zagreb. (ISBN 953-0-40012-8)
  2. Tadić, Marko (1994) Računalna obradba morfologije hrvatskoga književnog jezika, doktorska disertacija, Filozofski fakultet Sveučilišta u Zagrebu, Zagreb, 160 str. pdf
  3. Tadić, Marko (2003) Jezične tehnologije i hrvatski jezik, Exlibris, Zagreb. (ISBN 953-6310-19-8)
  4. Božo Bekavac (2005), Strojno prepoznavanje naziva u suvremenim hrvatskim tekstovima, doktorska disertacija, Filozofski fakultet Sveučilišta u Zagrebu, Zagreb, 172 str. sažetak

Papers

  1. Tadić, Marko (1990) »Zašto nam je potreban višemilijunski referentni korpus?« u: Andrijašević-Vrhovac (ur.) Informatička tehnologija u primijenjenoj lingvistici, Društvo za primijenjenu lingvistiku Hrvatske, Zagreb, str. 95-98. pdf
  2. Tadić, Marko (1991) »Od korpusa do čestotnoga rječnika hrvatskoga književnog jezika«, Radovi Zavoda za slavensku filologiju 27, str. 169-178. (ISSN 0514-5090)
  3. Tadić, Marko (1996) »Računalna obradba hrvatskoga i nacionalni korpus«, Suvremena lingvistika 41-42, str. 603-612. (ISSN 0586-0296) rtf  pdf ps
  4. Tadić, Marko (1997) »Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive«, Suvremena lingvistika 43-44, str. 387-394. (ISSN 0586-0296) rtf  pdf  ps
  5. Bekavac, Božo (1997) »Tečaj računalne leksikografije Ramesha Krishnamurthyja«, Suvremena lingvistika 23, 43-44; str. 437-438 (ISSN 0586-0296)
  6. Tadić, Marko (1998) »Raspon, opseg i sastav korpusa suvremenoga hrvatskoga jezika«, Filologija 30-31, str. 337-347. (ISSN 0449-363X) rtf  pdf ps
  7. Tadić, Marko (2000) »Building the Croatian-English Parallel Corpus«, LREC2000 zbornik, Atena, 31. svibnja-2. lipnja 2000, ELRA, Pariz-Atena, Vol. I, str. 523-530. doc  pdf ps
  8. Tadić, Marko (2000) »Uporaba XML-a u hrvatskim korpusima«, CroInfo2000 – Upravljanje informacijama u gospodarstvu i znanosti, zbornik, Dubrovnik, 16-18. listopada 2000, Nacionalna i sveučilišna knjižnica-Pliva, Zagreb, str. 132-137. (ISBN ISBN 953-6000-89-X) doc pdf ps
  9. Požgaj-Hadži, Vesna; Tadić, Marko (2000) »Hrvatsko-slovenski paralelni korpus«, u: Erjavec, Tomaž–Gros, Jerneja (ur.) Jezikovne tehnologije / Language Technologies 2000, zbornik, Ljubljana, 17-18. listopada 2000, Institut Jožef Stefan, Ljubljana, str. 70-74. (ISBN 961-6303-25-2) doc pdf ps
  10. Tadić, Marko (2001) »Procedures in Building the Croatian-English Parallel Corpus«, International Journal of Corpus Linguistics, poseban broj, str. 107-123. doc pdf ps
  11. Tadić, Marko; Simeon, Ivana (2001) »Building Croatian Language Technologies Portal«, CUC2001 Zbornik, CD-ROM, Zagreb, 24-26. rujna 2001, CARNet, Zagreb. (ISBN 953-6802-03-1) doc pdf ps
  12. Tadić, Marko; Šojat, Krešimir (2002) »Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu«, Filologija 38-39, str. 247-262. (ISSN 0449-363X) doc  pdf ps
  13. Tadić, Marko (2002) »Building the Croatian National Corpus«, LREC2002 zbornik, Las Palmas, 27. svibnja-2. lipnja 2002, ELRA, Pariz-Las Palmas, Vol. II, str. 441-446. doc  pdf ps
  14. Erjavec, Tomaž; Krstev, Cvetana; Petkevič, Vladimir; Simov, Kiril; Tadić, Marko; Vitas, Duško (2003) »The MULTEXT-East Morphosyntactic Specifications for Slavic Languages« u: Proceedings of the EACL2003 Workshop on Morphological Processing of Slavic Languages (Budimpešta 2003), ACL, str. 25-32 (ISBN 1-932432-02-7). pdf
  15. Tadić, Marko; Fulgosi, Sanja (2003) »Building the Croatian Morphological Lexicon«, u: Proceedings of the EACL2003 Workshop on Morphological Processing of Slavic Languages (Budimpešta 2003), ACL, str. 41-46. pdf
  16. Tadić, Marko; Bekavac, Božo (2003) »Preparation of POS tagging of Croatian using CLaRK System« u: Proceeding of RANLP2003 Conference (Borovets 2003), Bugarska akademija znanosti, str. 455-459 (ISBN 954-90906-6-3) pdf
  17. Tadić, Marko, Šojat, Krešimir (2003) »Finding Multiword Term Candidates in Croatian« u: Proceedings of IESL2003 Workshop (Borovets 2003), Bugarska akademija znanosti, str. 102-107 (ISBN ISBN 954-8361-06-X) pdf
  18. Tadić, Marko; Fulgosi, Sanja; Šojat, Krešimir (2004) »The Applicability of Lemmatization in Translational Equivalents Detection« u: Barnbrook, Geoff; Danielsson, Pernilla; Mahlberg, Michaela Meaningful Texts: The Extraction of Semantic Information from Monolingual and Multilingual Corpora, Continuum Books, London-New York, str. 195-206 (ISBN 082647490X) Opis knjige
  19. Tadić, Marko; Oliver, Antoni (2004) »Enlarging the Croatian Morphological Lexicon by Automatic Lexical Acquisition from Raw Corpora«, u: LREC2004 zbornik, Lisabon, 24.-30. svibnja 2004, ELRA, Pariz-Lisabon 2004, Vol. IV, str. 1259-1262 (ISBN 2-9517408-1-6). pdf
  20. Bekavac, Božo; Osenova, Petya; Simov, Kiril; Tadić, Marko (2004) »Making Monolingual Corpora Comparable: a Case Study of Bulgarian and Croatian«, u: LREC2004 zbornik, Lisabon, 24.-30. svibnja 2004, ELRA, Pariz-Lisabon 2004, Vol. IV, str. 1187-1190 (ISBN 2-9517408-1-6). pdf
  21. Bekavac, Božo, Šojat, Krešimir; Tadić, Marko (2005) »Zašto nam treba hrvatski WordNet?« u: Granić, Jagoda (ur.) Semantika prirodnog jezika i metajezik semantike, Zbornik HDPL-a 2004, Zagreb-Split, str. 733-743 (ISBN 953-96391-6-6). pdf
  22. Geci, Branko; Bekavac, Božo (2005), »A Formal Model of text annotation based on XML entities« u: Zbornik radova XXVIII. INTERNATIONAL CONVENTION, MEET & HGS, MIPRO 2005, Opatija, str. 295-300.
  23. Bekavac, Božo (2005) »Jezične tehnologije i hrvatski jezik autora Marka Tadića«, Suvremena lingvistika 57-58; str. 128-131 (ISSN 0586-0296)