Radovi

Kronološki popis za HNK relevantnih radova suradnika u Zavodu za lingvistiku na računalnolingvističkim i korpusnolingvističkim projektima:

Knjige

  1. Moguš, Milan; Bratanić, Maja; Tadić, Marko (1999) Hrvatski čestotni rječnik, Školska knjiga-Zavod za lingvistiku Filozofskoga fakulteta Sveučilišta u Zagrebu, Zagreb. (ISBN 953-0-40012-8)
  2. Tadić, Marko (1994) Računalna obradba morfologije hrvatskoga književnog jezika, doktorska disertacija, Filozofski fakultet Sveučilišta u Zagrebu, Zagreb, 160 str. pdf
  3. Tadić, Marko (2003) Jezične tehnologije i hrvatski jezik, Exlibris, Zagreb. (ISBN 953-6310-19-8)
  4. Božo Bekavac (2005), Strojno prepoznavanje naziva u suvremenim hrvatskim tekstovima, doktorska disertacija, Filozofski fakultet Sveučilišta u Zagrebu, Zagreb, 172 str. sažetak

Članci

  1. Tadić, Marko (1990) »Zašto nam je potreban višemilijunski referentni korpus?« u: Andrijašević-Vrhovac (ur.) Informatička tehnologija u primijenjenoj lingvistici, Društvo za primijenjenu lingvistiku Hrvatske, Zagreb, str. 95-98. pdf
  2. Tadić, Marko (1991) »Od korpusa do čestotnoga rječnika hrvatskoga književnog jezika«, Radovi Zavoda za slavensku filologiju 27, str. 169-178. (ISSN 0514-5090)
  3. Tadić, Marko (1996) »Računalna obradba hrvatskoga i nacionalni korpus«, Suvremena lingvistika 41-42, str. 603-612. (ISSN 0586-0296) rtf  pdf ps
  4. Tadić, Marko (1997) »Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive«, Suvremena lingvistika 43-44, str. 387-394. (ISSN 0586-0296) rtf  pdf  ps
  5. Bekavac, Božo (1997) »Tečaj računalne leksikografije Ramesha Krishnamurthyja«, Suvremena lingvistika 23, 43-44; str. 437-438 (ISSN 0586-0296)
  6. Tadić, Marko (1998) »Raspon, opseg i sastav korpusa suvremenoga hrvatskoga jezika«, Filologija 30-31, str. 337-347. (ISSN 0449-363X) rtf  pdf ps
  7. Tadić, Marko (2000) »Building the Croatian-English Parallel Corpus«, LREC2000 zbornik, Atena, 31. svibnja-2. lipnja 2000, ELRA, Pariz-Atena, Vol. I, str. 523-530. doc  pdf ps
  8. Tadić, Marko (2000) »Uporaba XML-a u hrvatskim korpusima«, CroInfo2000 – Upravljanje informacijama u gospodarstvu i znanosti, zbornik, Dubrovnik, 16-18. listopada 2000, Nacionalna i sveučilišna knjižnica-Pliva, Zagreb, str. 132-137. (ISBN ISBN 953-6000-89-X) doc pdf ps
  9. Požgaj-Hadži, Vesna; Tadić, Marko (2000) »Hrvatsko-slovenski paralelni korpus«, u: Erjavec, Tomaž–Gros, Jerneja (ur.) Jezikovne tehnologije / Language Technologies 2000, zbornik, Ljubljana, 17-18. listopada 2000, Institut Jožef Stefan, Ljubljana, str. 70-74. (ISBN 961-6303-25-2) doc pdf ps
  10. Tadić, Marko (2001) »Procedures in Building the Croatian-English Parallel Corpus«, International Journal of Corpus Linguistics, poseban broj, str. 107-123. doc pdf ps
  11. Tadić, Marko; Simeon, Ivana (2001) »Building Croatian Language Technologies Portal«, CUC2001 Zbornik, CD-ROM, Zagreb, 24-26. rujna 2001, CARNet, Zagreb. (ISBN 953-6802-03-1) doc pdf ps
  12. Tadić, Marko; Šojat, Krešimir (2002) »Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu«, Filologija 38-39, str. 247-262. (ISSN 0449-363X) doc  pdf ps
  13. Tadić, Marko (2002) »Building the Croatian National Corpus«, LREC2002 zbornik, Las Palmas, 27. svibnja-2. lipnja 2002, ELRA, Pariz-Las Palmas, Vol. II, str. 441-446. doc  pdf ps
  14. Erjavec, Tomaž; Krstev, Cvetana; Petkevič, Vladimir; Simov, Kiril; Tadić, Marko; Vitas, Duško (2003) »The MULTEXT-East Morphosyntactic Specifications for Slavic Languages« u: Proceedings of the EACL2003 Workshop on Morphological Processing of Slavic Languages (Budimpešta 2003), ACL, str. 25-32 (ISBN 1-932432-02-7). pdf
  15. Tadić, Marko; Fulgosi, Sanja (2003) »Building the Croatian Morphological Lexicon«, u: Proceedings of the EACL2003 Workshop on Morphological Processing of Slavic Languages (Budimpešta 2003), ACL, str. 41-46. pdf
  16. Tadić, Marko; Bekavac, Božo (2003) »Preparation of POS tagging of Croatian using CLaRK System« u: Proceeding of RANLP2003 Conference (Borovets 2003), Bugarska akademija znanosti, str. 455-459 (ISBN 954-90906-6-3) pdf
  17. Tadić, Marko, Šojat, Krešimir (2003) »Finding Multiword Term Candidates in Croatian« u: Proceedings of IESL2003 Workshop (Borovets 2003), Bugarska akademija znanosti, str. 102-107 (ISBN ISBN 954-8361-06-X) pdf
  18. Tadić, Marko; Fulgosi, Sanja; Šojat, Krešimir (2004) »The Applicability of Lemmatization in Translational Equivalents Detection« u: Barnbrook, Geoff; Danielsson, Pernilla; Mahlberg, Michaela Meaningful Texts: The Extraction of Semantic Information from Monolingual and Multilingual Corpora, Continuum Books, London-New York, str. 195-206 (ISBN 082647490X) Opis knjige
  19. Tadić, Marko; Oliver, Antoni (2004) »Enlarging the Croatian Morphological Lexicon by Automatic Lexical Acquisition from Raw Corpora«, u: LREC2004 zbornik, Lisabon, 24.-30. svibnja 2004, ELRA, Pariz-Lisabon 2004, Vol. IV, str. 1259-1262 (ISBN 2-9517408-1-6). pdf
  20. Bekavac, Božo; Osenova, Petya; Simov, Kiril; Tadić, Marko (2004) »Making Monolingual Corpora Comparable: a Case Study of Bulgarian and Croatian«, u: LREC2004 zbornik, Lisabon, 24.-30. svibnja 2004, ELRA, Pariz-Lisabon 2004, Vol. IV, str. 1187-1190 (ISBN 2-9517408-1-6). pdf
  21. Bekavac, Božo, Šojat, Krešimir; Tadić, Marko (2005) »Zašto nam treba hrvatski WordNet?« u: Granić, Jagoda (ur.) Semantika prirodnog jezika i metajezik semantike, Zbornik HDPL-a 2004, Zagreb-Split, str. 733-743 (ISBN 953-96391-6-6). pdf
  22. Geci, Branko; Bekavac, Božo (2005), »A Formal Model of text annotation based on XML entities« u: Zbornik radova XXVIII. INTERNATIONAL CONVENTION, MEET & HGS, MIPRO 2005, Opatija, str. 295-300.
  23. Bekavac, Božo (2005) »Jezične tehnologije i hrvatski jezik autora Marka Tadića«, Suvremena lingvistika 57-58; str. 128-131 (ISSN 0586-0296)