Struktura i izvori

Idealna struktura

Idealna struktura korpusnih uzoraka s obzirom na medij, vrstu publikacije, žanr, područje i temu dana je tablici:

Vrsta teksta %
Informativni tekstovi 74
  Novine 37
    dnevnici 22
    tjednici  9
    dvotjednici  6
  Časopisi, revije 16
    tjednici  9
    mjesečnici  4
    dvo-, tromjesečnici  3
  Knjige, brošure, pisma... 21
    publicistika  4
    popularni tekstovi 3.5
    korespondencija, efemera 0.5
    znanosti i umjetnosti 13
Imaginativni tekstovi (fiction) 23
    romani 13
    pripovijetke, novele, crtice  5
    ogledi  4
    dnevnici, (auto)biografije...  1
Miješani tekstovi  3

Kako je sastavljanje korpusa još u tijeku, željena ravnoteža još uvijek nije dosegnuta, no ona predstavlja zacrtani cilj. Kad se skupi dovoljna količina tekstova za potpuno popunjavanje svake željene sastavnice, onda će se prema zacrtanoj strukturi odabrati konačni tekstni odsječci do opsega 100 milijuna pojavnica (100 Mw). Do tog će vremena sve što je skupljeno biti dostupno za pretragu. Naime, procijenilo se da je važnije javno ponuditi pristup HNK-u, makar on bio nepotpun i nedovoljno uravnotežen, jer se tako ipak postiže njegovo brže uvođenje u lingvistička istraživanja hrvatskoga jezika, olakšava prisutnost hrvatske jezične građe na domaćim i inozemnim sveučilištima i njihovim kroatističkim tj. slavističkim odsjecima te podiže opća razina hrvatske jezične kulture.

Dosegnuta struktura (HNK v 2.0)

U HNK su trenutačno uvršteni sljedeći potkorpusi:

Tipologija tekstova

HNK.M     medij
HNK.M.G    govoreni tekstovi
HNK.M.E    e-tekstovi
HNK.M.P    pisani tekstovi
HNK.M.P.O    objavljeni
HNK.M.P.O.B   brošure
HNK.M.P.O.K   knjige
HNK.M.P.O.N   novine
HNK.M.P.O.N.D   dnevnici
HNK.M.P.O.N.T   tjednici
HNK.M.P.O.N.2   dvotjednici
HNK.M.P.O.R   revije, časopisi
HNK.M.P.O.R.T   tjednici
HNK.M.P.O.R.M   mjesečnici
HNK.M.P.O.R.V   dvo-, tromjesečnici
HNK.M.P.N    neobjavljeno
HNK.M.P.N.J   javno
HNK.M.P.N.I   interno
HNK.M.P.N.O   osobno

HNK.V    žanr
HNK.V.N   informativni tekstovi (faction)
HNK.V.N.Z   znanstveni tekstovi
HNK.V.N.Z.P  prirodne znanosti...
HNK.V.N.Z.T  tehničke znanosti...
HNK.V.N.Z.M  biomedicinske znanosti...
HNK.V.N.Z.B  biotehničke znanosti...
HNK.V.N.Z.D  društvene znanosti...
HNK.V.N.Z.H  humanitističke znanosti...
HNK.V.N.S	 stručni tekstovi
HNK.V.N.S.Z  putopisi
HNK.V.N.S.K  kritika
HNK.V.N.S.M  mediji
HNK.V.N.S.C  kriminalistika
HNK.V.N.S.S  sport
HNK.V.N.S.P  politika
HNK.V.N.S.E  ekologija, bioetika itd.
...
HNK.V.N.N	 nestručni tekstovi
HNK.V.N.N.P  publicistika
HNK.V.N.N.O  popularni tekstovi
HNK.V.N.N.E  efemera

HNK.V.U	 imaginativni tekstovi (fiction)
HNK.V.U.P	  proza...
HNK.V.U.D	  drama...
HNK.V.U.S	  poezija...

HNK.V.M   miješani tekstovi