Obradba korpusa 3: obilježavanje korpusa
1988, kad je obilježavanje pocelo, današnji standard za obilježavanje korpusa — SGML (a kamoli XML) još nije ni bio u vidokrugu lingvista
odabran sustav obilježavanja koji se mogao preobliciti u tadanji de facto standard COCOA
n #pxxxggs n
- p = potkorpus (Drama, Novine, Proza, Stihovi, Udžbenici)
- xxx = broj uzorka u potkorpusu
- gg = godina izdanja djela (?? za nepoznate)
- s = sastavnica tekstovne strukture (G glavni naslov, I nadnaslov, N naslov, P podnaslov, T tijelo teksta, S sažetak, O potpis, K kazalo/sadržaj, M motto, posveta)