Kollokatsioonidest
Kollokatsioonid on sellised sõnapaarid, mille liikmed esinevad üksteise naabruses sagedamini kui võiks eeldada nende üksikult esinemise sageduste põhjal. Tüüpilised kollokatsioonid on püsiühendid - näiteks ühendverbid või idiomaatilised väljendid. Püsiühendid võivad muidugi koosneda ka rohkem kui kahest sõnast, kuid meie kollokatsioonide otsija suudab tuvastada ainult kahesõnalisi ühendeid.
Kollokatsioonide otsimisel arvestatakse võimalike kollokaatide kandidaatidena samas osalauses esinevaid sõnavorme või lemmasid.
Kollokatsioone saab otsida kolmel viisil:
- 1) teatud lemma olulisi kollokaate sõnavormidena
- 2) teatud lemma olulisi kollokaate lemmadena
- 3) teatud sõnavormi olulisi kollokaate sõnavormidena
Nii sisestava lemma või sõnavormi kui ka otsitavate kollokaatide ringi saab piirata nende sõnaliigilise kuuluvusega. Sõnaliigi märgendid:
_A_ | omadussõna - algvõrre (adjektiiv - positiiv), nii käänduvad kui käändumatud, nt kallis või eht |
_C_ | omadussõna - keskvõrre (adjektiiv - komparatiiv), nt laiem |
_D_ | määrsõna (adverb), nt kõrvuti |
_G_ | genitiivatribuut (käändumatu omadussõna), nt balti |
_H_ | pärisnimi, nt Edgar |
_I_ | hüüdsõna (interjektsioon), nt tere |
_J_ | sidesõna (konjunktsioon), nt ja |
_K_ | kaassõna (pre/postpositsioon), nt kaudu |
_N_ | põhiarvsõna (kardinaalnumeraal), nt kaks |
_O_ | järgarvsõna (ordinaalnumeraal), nt teine |
_P_ | asesõna (pronoomen), nt see |
_S_ | nimisõna (substantiiv), nt asi |
_U_ | omadussõna - ülivõrre (adjektiiv - superlatiiv), nt pikim |
_V_ | tegusõna (verb), nt lugema |
_X_ | verbi juurde kuuluv sõna, millel eraldi sõnaliigi tähistus puudub, nt plehku |