Životopis

e-mail:
marko.tadic@ffzg.hr

English language

Marko Tadić


Rođen:
1963-08-28

Obrazovanje:
U Zagrebu završio osnovnu školu i Klasičnu gimnaziju te diplomirao 1987. godine na Filozofskom fakultetu Sveučilišta u Zagrebu gdje sam studirao opću lingvistiku, fonetiku, latinski i društveno-humanističku informatiku.

U siječnju 1988. počeo raditi kao znanstveni novak u Zavodu za lingvistiku Filozofskoga fakulteta Sveučilišta u Zagrebu gdje i danas vodim projekt MZOŠ-a 0130418.

Stručna usavršavanja na sveučilištima u Pisi 1989. i Birminghamu 1991.

Magistrirao 1992. i doktorirao 1994. s temom Računalna obradba morfologije hrvatskoga književnoga jezika na Filozofskome fakultetu Sveučilišta u Zagrebu.

Znanstveno zvanje docenta pri Odsjeku za lingvistiku Filozofskoga fakulteta Sveučilišta u Zagrebu stekao 1998-10.

Od 2001. predstojnik je Katedre za algebarsku i informatičku lingvistiku.

Od 2003. do 2007. pročelnik je Odsjeka za lingvistiku.

Znanstveno zvanja izvanrednoga profesora stekao 2004.

Predaje na istom Odsjeku kolegije:

Predaje na poslijediplomskim studijima Filozofskoga fakulteta Sveučilišta u Zagrebu:

Na ljetnoj školi Jadertina Summer School in Empirical and Computational Linguistics (JSSECL) u organizaciji Sveučilišta u Zadru, Instituta za hrvatski jezik i jezikoslovlje te Hrvatskoga društva za jezične tehnologije (HDJT) predavao je:

Na Tehničkom veleučilištu u Zagrebu od 1998. do 2002. predavao je kolegij Računalna lingvistika.

Bio članom organizacijskih odbora:

  • simpozija Jezici u kontaktu u okviru 12. svjetskog antropološkog kongresa održanog u Zagrebu 1988.

  • simpozija Kompjutorska lingvistika i jezična tehnologija — potrebe i perspektive održanog u suradnji s Europskim vijećem u Dubrovniku 1989.

  • 7. TELRI seminara održanoga u suradnji sa Sveučilištem u Birminghamu i TELRI udrugom u Dubrovniku 26.-29. rujna 2002. (predsjednik organizacijskoga odbora).

Bio članom programskih ili znanstvenih odbora skupova:

  • Shallow Processing of Large Corpora u okviru konferencije Corpus Linguistics 2003 u Lancasteru (Ujedinjeno kraljevstvo Velike Britanije i Sjeverne Irske), 27. ožujka 2003.

  • Morphological Processing of Slavic Languages u okviru konferencije EACL2003 u Budimpešti (Madžarska), 14. travnja 2003.

  • Adaptation of Automatic Learning Methods for Analytical and Flective Languages u okviru ESSLI2003 konferencije u Beču (Austrija),18-22. kolovoza 2003.

  • Information Extraction for Slavonic and other Central and Eastern European Languages u okviru konferencije RANLP2003 u Borovetsu (Bugarska), 8-9. rujna 2003.

  • Natural Language Understanding and Cognitive Science u okviru Sixth International Conference on Enterprise Information Systems — ICEIS 2004 u Portu (Portugal), 13. travnja 2004.

  • Language Resources and Evaluation Conference (LREC2006) u Genovi (Italija), 22.-28. svibnja 2006.

  • European Semantic Web Conference (ESWC2006) u Budvi (Crna Gora), 11.-14. lipnja 2006.

  • Language Resources and Evaluation Conference (LREC2008) u Marakešu (Maroko), 26.-31. svibnja 2008.

Voditelj Zagrebačkoga lingvističkog kruga u akademskoj godini 1995/96.

Od 1997. član je uredništva časopisa Suvremena lingvistika citiranog u MLA, BL i LLBA.

U 1999. i 2000. član je Upravnoga vijeća CARNet-a (Croatian Academic Research Network).

Od 2000. član je Odbora za leksikografiju Razreda za filološke znanosti Hrvatske akademije znanosti i umjetnosti.

Od 2005. član je Područnoga vijeća za humanističke znanosti Ministarstva znanosti, obrazovanja i športa RH i Vijeća društveno-humanističkoga područja Sveučilišta u Zagrebu.

Predsjednik je i jedan od osnivača Hrvatskoga društva za jezične tehnologije. Član je Hrvatskoga filološkoga društva, Hrvatskoga društva za primijenjenu lingvistiku, Slovenskog društva za jezične tehnologije, TELRI asocijacije (TransEuropean Language Resources Infrastructure) međunarodne udruge za promicanje jezičnih resursa, Udruge za računalno jezikoslovlje (ACL), Europske udruge za strojno prevođenje (EAMT) i Međunarodne udruge za strojno prevođenje (IAMT), Svjetske udruge za WordNet (GWA).

Područja interesa:
računalno jezikoslovlje, korpusna lingvistika, računalna leksikografija, računalna obradba morfologije, SGML/XML, strojno (potpomognuto) prevođenje

Istraživački programi (voditelj):

Istraživački projekti (voditelj):

I-projekti (voditelj):

Knjige:

  • (s Milanom Mogušem i Majom Bratanić) Hrvatski čestotni rječnik, Školska knjiga–Zavod za lingvistiku Filozofskoga fakulteta Sveučilišta u Zagrebu, Zagreb 1999. (ISBN 953-0-40012-8)

  • Jezične tehnologije i hrvatski jezik, Exlibris, Zagreb 2003. (ISBN 953-6310-19-8)

Važniji radovi: (Cjelovit popis vidjeti na CROSBI-ju)

  • »Zašto nam treba višemilijunski referentni korpus?«, Informatička tehnologija u primijenjenoj lingvistici, Društvo za primijenjenu lingvistiku Hrvatske, Zagreb, 1990, str. 95-98.

  • »Od korpusa do čestotnoga rječnika hrvatskoga književnog jezika«, Radovi Zavoda za slavensku filologiju 27, (1991), str. 169-178. (ISSN 0514-5090)

  • »Problemi računalne obrade imeničnih oblika u hrvatskome«, Suvremena lingvistika 34, (1992), str. 301-308. (ISSN 0586-0296) pdf

  • Računalna obrada morfologije hrvatskoga književnog jezika, doktorska disertacija, Filozofski fakultet Sveučilišta u Zagrebu, Zagreb 1994, 160 str. pdf

  • »Računalna obradba hrvatskoga i nacionalni korpus«, Suvremena lingvistika 41-42, (1996), str. 603-612. (ISSN 0586-0296) rtf  pdf ps

  • »Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive«, Suvremena lingvistika 43-44, (1997), str. 387-394. (ISSN 0586-0296) rtf  pdf  ps

  • »Računalni pogled na Šulekov rječnik znanstvenoga nazivlja«, Zbornik o Bogoslavu Šuleku, HAZU, Zagreb 1998, str. 149-159. (ISBN 953-154-367-4)

  • »Electronic edition of the Plato's Republic« u: Erjavec, Tomaž–Lawson, Ann–Romary, Laurent (ur.): East meets West — A Compendium of Multilingual Resources, TELRI-IDS, Mannheim, 1998. (ISBN 3-922641-46-6)

  • »Raspon, opseg i sastav korpusa suvremenoga hrvatskoga jezika«, Filologija 30-31, (1998), str. 337-347. (ISSN 0449-363X) rtf  pdf ps

  • »Building the Croatian-English Parallel Corpus«, LREC2000 zbornik, Atena, 31. svibnja-2. lipnja 2000, ELRA, Pariz-Atena 2000, Vol. I, str. 523-530. doc  pdf ps

  • »Information Retrieval Meets Human Language Technology«, CUC2000 Zbornik, CD-ROM, Zagreb, 24-26. rujna 2000, CARNet, Zagreb 2000. (ISBN 953-6802-01-5) doc pdf ps

  • »Uporaba XML-a u hrvatskim korpusima«, CroInfo2000 – Upravljanje informacijama u gospodarstvu i znanosti, zbornik, Dubrovnik, 16-18. listopada 2000, Nacionalna i sveučilišna knjižnica-Pliva, Zagreb 2000, str. 132-137. (ISBN ISBN 953-6000-89-X) doc pdf ps

  • (s Vesnom Požgaj-Hadži) »Hrvatsko-slovenski paralelni korpus«, u: Erjavec, Tomaž–Gros, Jerneja (ur.) Jezikovne tehnologije / Language Technologies 2000, zbornik, Ljubljana, 17-18. listopada 2000, Institut Jožef Stefan, Ljubljana 2000, str. 70-74. (ISBN 961-6303-25-2) doc pdf ps

  • »Procedures in Building the Croatian-English Parallel Corpus«, International Journal of Corpus Linguistics, poseban broj, (2001), str. 107-123. doc pdf ps

  • (s Ivanom Simeon) »Building Croatian Language Technologies Portal«, CUC2001 Zbornik, CD-ROM, Zagreb, 24-26. rujna 2001, CARNet, Zagreb 2001. (ISBN 953-6802-03-1) doc pdf ps

  • (s Krešimirom Šojatom) »Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu«, Filologija 38-39, (2002), str. 247-262. (ISSN 0449-363X) doc  pdf ps

  • »Building the Croatian National Corpus«, LREC2002 zbornik, Las Palmas, 27. svibnja-2. lipnja 2002, ELRA, Pariz-Las Palmas 2002, Vol. II, str. 441-446. doc  pdf ps

  • (s Tomažem Erjavcom, Cvetanom Krstev, Vladimirom Petkevičem, Kirilom Simovim i Duškom Vitasom) »The MULTEXT-East Morphosyntactic Specifications for Slavic Languages« u: Proceedings of the EACL2003 Workshop on Morphological Processing of Slavic Languages (Budimpešta 2003), ACL, str. 25-32 (ISBN 1-932432-02-7). pdf

  • (sa Sanjom Fulgosi) »Building the Croatian Morphological Lexicon«, u: Proceedings of the EACL2003 Workshop on Morphological Processing of Slavic Languages (Budimpešta 2003), ACL, str. 41-46. pdf

  • (s Božom Bekavcem) »Preparation of POS tagging of Croatian using CLaRK System« u: Proceeding of RANLP2003 Conference (Borovets 2003), Bugarska akademija znanosti, str. 455-459 (ISBN 954-90906-6-3) pdf

  • (s Krešimirom Šojatom) »Finding Multiword Term Candidates in Croatian« u: Proceedings of IESL2003 Workshop (Borovets 2003), Bugarska akademija znanosti, str. 102-107 (ISBN ISBN 954-8361-06-X) pdf

  • (sa Sanjom Fulgosi i Krešimirom Šojatom) »The Applicability of Lemmatization in Translational Equivalents Detection« u: Barnbrook, Geoff; Danielsson, Pernilla; Mahlberg, Michaela Meaningful Texts: The Extraction of Semantic Information from Monolingual and Multilingual Corpora, Continuum Books, London-New York 2004, str. 195-206 (ISBN 082647490X) Opis knjige

  • (with Antoni Oliver) »Enlarging the Croatian Morphological Lexicon by Automatic Lexical Acquisition from Raw Corpora«, u: LREC2004 zbornik, Lisabon, 24.-30. svibnja 2004, ELRA, Pariz-Lisabon 2004, Vol. IV, str. 1259-1262 (ISBN 2-9517408-1-6). pdf

  • (with Božo Bekavac, Petya Osenova, Kiril Simov) »Making Monolingual Corpora Comparable: a Case Study of Bulgarian and Croatian«, u: LREC2004 zbornik, Lisabon, 24.-30. svibnja 2004, ELRA, Pariz-Lisabon 2004, Vol. IV, str. 1187-1190 (ISBN 2-9517408-1-6). pdf

  • (s Krešimirom Šojatom i Božom Bekavcem) »Zašto nam treba hrvatski WordNet?« u: Granić, Jagoda (ur.) Semantika prirodnog jezika i metajezik semantike, Zbornik HDPL-a 2004, Zagreb-Split 2005, str. 733-743 (ISBN 953-96391-6-6). pdf

  • »Developing the Croatian National Corpus and Beyond« u: Grzybek, Peter (ur.) Contributions to the Science of Text and Language. Word Length Studies and Related Issues, Kluwer, Dordrecht 2006, str. 295-300. (ISBN 1-4020-4067-9) Opis knjige

  • (sa Željkom Agićem) »Evaluating Morphosyntactic Tagging of Croatian Texts« u: LREC2006 zbornik, Genova, 23.-25. svibnja 2006, ELRA, Genova-Pariz 2006. (ISBN 2-9517408-2-4) pdf

  • (s Božom Bekavcem) »Inflectionally Sensitive Web Search in Croatian using Croatian Lemmatization Server« u: Lužar-Stiffler, Vesna & Hljuz Dobrić, Vesna (ur.) Proceedings of ITI2006 Conference, SRCE, Zagreb 2006, str. 481-486. (ISBN 953-7138-05-4, ISSN 1330-1012) pdf

  • (s Božom Bekavcem) »Inflectionally Sensitive Web Search in Croatian using Croatian Lemmatization Server« u: Lužar-Stiffler, Vesna & Hljuz Dobrić, Vesna (ur.) Proceedings of ITI2006 Conference, SRCE, Zagreb 2006, str. 521-528. (ISBN 953-7138-05-4, ISSN 1330-1012) pdf

  • »Croatian Lemmatization Server« u: Koeva, Svetla & Dimitrova-Voulchanova, Mila (ur.) Proceedings of the 5th Formal approaches to South Slavic and Balkan languages Conference (FASSBL2006), Bugarska akademija znanosti, Sofija 2006, str. 140-146. pdf

  • »Croatian Dependency Treebank in Multilingual Context« u: Slavcheva, Milena; Angelova, Galia; Simov, Kiril (ur.). Readings in Multilinguality. Selected papers for young researchers, Bugarska akademija znanosti, Sofija 2006, str. 125-128. (ISBN 954-91743-6-0) pdf

  • (sa Zdravkom Dovedanom, Idom Raffaelli, Sanjom Seljan i Bojanom Dalbelo Bašić) »Computational Linguistic Models and Language Technologies for Croatian« u: Lužar-Stiffler, Vesna & Hljuz Dobrić, Vesna (ur.) Proceedings of ITI2007 Conference, SRCE, Zagreb 2007, str. 521-528. (ISBN 953-7138-05-4, ISSN 1330-1012) pdf

  • (s Božom Bekavcem) »Implementation of Croatian NERC system« u: Piškorski, Jakub; Tanev, Hristo; Pouliquen, Bruno; Steinberger, Ralf (ur.) Proceedings of the Workshop on Balto-Slavonic Natural Language Processing 2007, ACL, Prag 2007, str. 11-18. (ISBN 978-1-932432-88-6) pdf

  • »Building the Croatian Dependency Treebank: the initial stages«, Suvremena lingvistika 63, (2007) str. 85-92. (ISSN 0586-0296) pdf

Pozvana predavanja i konferencije:

  • »Napredak u radu na Hrvatskom nacionalnom korpusu«, Drugi hrvatski slavistički kongres, Osijek, 1999-09-14—18. prezentacija

  • »Hrvatski čestotni rječnik«, pozvano predavanje, Filozofski fakultet, Sveučilište u Ljubljani, 1999-10-26. prezentacija

  • »Procedures in building Croatian-English parellel corpus«, 4th TELRI seminar, Bratislava, 1999-11-4—7. prezentacija

  • »Corpus-building projects in Institute of linguistics, Philosophical Faculty, University of Zagreb«, pozvano predavanje, Sveučilište u Tübingenu, 1999-12-01. prezentacija

  • »Korpusni projekti u Zavodu za lingvistiku Filozofskoga fakulteta Sveučilišta u Zagrebu«, Hrvatsko društvo za primijenjenu lingvistiku, godišnji skup, Opatija 2000-05-19—20. prezentacija

  • (s Vesnom Požgaj-Hadži) »Slovensko-hrvatski paralelni korpus«, Hrvatsko društvo za primijenjenu lingvistiku, godišnji skup, Opatija, 19-20. svibnja 2000-05-19—20. prezentacija

  • (s Krešimirom Šojatom) »Possibilities of Identification of Translation Equivalents in a Parallel Corpus«, 5th TELRI seminar, Ljubljana, 2000-09-20—24. prezentacija

  • »Encoding Croatian Corpora«, pozvano predavanje, Sveučilište u Tübingenu, 2001-02-22 prezentacija

  • »Developing Croatian National Corpus and beyond«, Wortlängen in Texten, Sveučilište Karl-Franzens u Grazu, 2002-06-23. prezentacija

  • »Croatian National Corpus and its Tagging«, Slovački nacionalni korpus, Institut za slovački jezik L'udovit Štúr, Slovačka akademija znanosti, Bratislava, 2003-12-01. prezentacija

  • (s Bojanom Dalbelo Bašić) »Computer Aided Document Indexing System (CADIS) with Eurovoc«, EUROVOC Conference 2006, Europski parlament, Bruxelles, Belgija, 2006-03-10. prezentacija

  • (s Bojanom Dalbelo Bašić i Marie-Francine Moens) »Computer Aided Document Indexing System (CADIS) with Eurovoc«, Workshop "Toegang Tot De Wet", Katholieke Universiteit Leuven, Belgija, 2007-05-22. prezentacija

  • »Language Technologies: a Happy Marriage between Linguistics and Informatics«, European Computer Science Summit - ECSS 2009, Pariz, Francuska, 2009-10-09. prezentacija

Slika s kravatom

foto: Primož Jakopin

Moji klinci ljeti

foto: MT