Kontsulta-sistemaren helburua da erabiltzaileak corpusean dagoen informazioa ikusteko eta aztertzeko aukera ematea. ZT corpusetik hainbat informazio-mota eskura daiteke, eta, horregatik, kontsulta-sistemak ere hainbat aukera eskaintzen ditu. Hona hemen interesgarriak izan daitezkeen adibide batzuk:
Horrelako eta bestelako hainbat bilaketa egiteko aukera ematen du ZT corpusaren kontsulta-sistemak. Honen guztiaren helburua da erabiltzaileari erabilera errealaren testigantzak eta datuak ematea, hark nahi duen gaia edo alderdia azter dezan.
ZT corpusa kontsultatzeko sistemak bi bilaketa-mota ditu: bilaketa arrunta eta bilaketa aurreratua. Hurrengo ataletan, horietako bakoitzaren ezaugarriak zehatz-mehatz azalduko ditugu, baina, horren aurretik, ideia orokor bat emango dugu. Oinarrizko egitura bera dute biek ere:
Hurrengo irudiak bi atal horiek bilaketa aurreratuan nola antolatu diren erakusten du:
1. irudia. Kontsulta-interfazearen ikuspegi eta antolaketa orokorra.
Hurrengo ataletan, aukera horiek guztiak zehatz azalduko dizkizugu. Bilaketa arruntari ekingo diogu lehenik.
HasieraraBilaketa arruntaren bidez corpusaren oinarrizko kontsultak egin daitezke, arin eta erraz. Corpus-kontsultan erabilienak izaten diren aukerak hautatu ditugu bilaketa arrunta diseinatzeko.
Honako aukerak ditu erabiltzaileak:
2. irudia. Bilaketa arruntaren bilaketa-atala.
Hauek dira erabil daitezkeen kategoria-balioak:
Izenondoak eta izenlagunak adjektiboa kategoria nagusian bildurik daude, -dun eta -(t)ar atzizkidun adjektiboekin batera.
Bilaketa arruntean, Bilatu laukian zerbait sartu behar da nahitaez bilaketa egiteko, hau da, ezin dugu Bilatu laukia hutsik utzi, Kategoria laukian, esaterako, 'det.' (determinatzailea) hautatu, eta bilaketa egin, determinatzaile guztien agerraldiak kontsultatzeko. Aukera hori ez eskaintzeko arrazoi nagusia da emaitzen multzoa oso handia litzatekeela. Bilaketa aurreratuan, ikusiko dugu hiru 'bilagai' zehazteko aukera izango dugula, eta kasu batzuetan kategoria erabil daitekeela irizpide murriztaile hustzat.
Bilaketa arruntean, emaitza-atala beti dago osatua ezkerraldeko taula-grafikoez eta eskuinaldeko testuinguruez edo KWIC ikuspegiaz (ingelesezko key word in context-etik). Aurrerago ikusiko dugunez, bilaketa aurreratuan aukera dago emaitza-motak hautatzeko. Bilaketa arruntean, testuinguruak ordenatzeko aukera dago:
Lehen esan bezala, bilaketa arruntean emaitza-atala beti dago osatua ezkerraldeko taula-grafikoez eta eskuinaldeko testuinguruez edo KWIC ikuspegiaz.
Erabiltzaileak egindako bilaketaren emaitzak (lemak edo formak) taula batean bistaratzen dira, ondoan maiztasunak dituztela (agerraldi-kopuruak) eta behealdean grafikoa dagoela.
3. irudia. Emaitza-ataleko kopuruen taula eta grafikoa.
Bilaketa-atalean Zer laukian 'Lema' eta Konp. laukian 'Da' hautatu badugu, taula honetan delako lemaren formak agertzen dira, maiztasunaren arabera ordenatuta. 'Da' hautatu beharrean 'Hasi' hautatuz gero, ikusiko duzu lemak bistaratzen direla. Zer laukian 'Forma' aukera sartuz gero, lemak bistaratzen dira 'Da' hautatzean, eta formak, berriz, 'Hasi' hautatzean.
Lehen bistaratzean, aurreneko hamar itemak (lemak edo formak) agertzen dira. Emaitza guztiak bistaratu nahi badira, 'Beste guztiak' aukera sakatu behar da. Dena den, grafikoan beti lehen hamar itemak bereizten dira, eta gainerakoak 'Beste guztiak' atalean biltzen dira. Grafikoa ulertzeko, kontuan izan koloreak taularen ezkerreko zutabean ageri diren koloreei dagozkiela, hau da, koloreak zerrendako lema edo formei dagozkiela.
Bilaketaren emaitzak pantailaratzen direnean, kontsulta-sistemak zerrendako item guztien agerraldiak bistaratzen ditu testuinguruen atalean. Emaitza-taulako item batean, lema zein forma batean, klik eginez, horri dagozkion testuinguruak bakarrik bistaratzen dira; atzera berriz guztien agerraldiak ikusi nahi izanez gero, 'Guztien testuinguruak batera' aukera sakatu behar da.
Emaitza-atalaren eskuinaldean, bilaketan aurkitutako agerraldien testuinguru laburrak agertzen dira, bilagaia erdian eta koloreztaturik dagoela.
4. irudia. Testuinguruen atala (KWIC).
Koloreek testuko hitzaren analisiaren ziurtasun- edo fidagarritasun-mailak adierazten dituzte, eta bilaketa aurreratuan zehatzago azalduko ditugu. Aski da oraingoz jakitea berde-hori-gorri koloreek segurutik ez hain segurura bitarteko mailak adierazten dituztela.
5. irudia. Gako-hitzaren nabarmentze-kolorea, analisiaren ziurtasunaren adierazgarri.
Non laukiaren balioa Eskuz zuzenduan denean, agerraldi guztiak berde argiz nabarmenduta daude, hori baita segurtasun handiena adierazten duen kolorea (eskuz berrikusi eta zuzendu diren analisiak dira berde argiz nabarmenduta daudenak).
Gogoan izan Ordenatu honen arabera aukeraz balia zaitezkeela testuinguruak gehien komeni zaizun irizpidearen arabera ordenatzeko, eta ezkerreko emaitza-taulan ageri den lema edo forma jakin baten testuinguruak bakarrik ikusi nahi badituzu, aski dela haren gainean klik egitea.
Adibidez, hona hemen ekuazio lemaren agerraldiak, testuan ondoan duten hitzaren arabera ordenatuta:
6. irudia. ekuazio lemaren agerraldiak, ondoko testuinguruaren arabera ordenatuta.
Hurrengoan, berriz, programa-z hasten diren lemak (bakunak zein hitz anitzekoak) (programa, programatu, programazio, programagarri, programatzaile programazio-lengoaia, programazio-formatu…), bakoitzaren maiztasunarekin eta agerraldiekin batera, horiek dokumentuaren arabera multzokatuta.
7. irudia. programa-z hasten diren lemak, dokumentuka.
Bestalde, testuinguru-atalaren argibide batzuk:
8. irudia. Gako-hitzaren informazio linguistikoa.
9. irudia. Testuinguru hedatuen eta metadatuen leihoa.
marka agertzeak adierazten du jatorrizko testuan irudi bat edo
testu ez den bestelako objektu bat zegoela (ekuazio-editoreekin sortutako formulak,
esaterako); horrelako objektuak ez dira corpuseratu (kontuan izan ZT corpusa baliabide
linguistikoa dela eta haren helburua ez dela testuak beren jatorrizko itxuran, formatuan
eta testu ez diren osagaiekin biltzea eta etiketatzea)
10. irudia.
etiketa.
Bilaketa aurreratuaren bidez, kontsulta sakonagoak eta zehatzagoak egiteko aukera duzu. Hauek dira bilaketa arruntari gehitu dizkiogun aukerak bilaketa aurreratua eratzeko:
Honako aukerak dituzu:
11. irudia. Bilaketa aurreratuaren bilaketa-atala.
Orain aukera duzu hiru bilagai erabiltzeko, eta batetik bestera dagoen distantzia zehazteko ere bai. Distantzia handiena 4 da (lau testu-hitz). Gainera, distantziaren norabidea ere aukera dezakezu (aurrerantz, atzerantz edo bietara).
Horrez gain, bilagai batean Bilatu eremua hutsik utz daiteke, eta kategoria soilik zehaztu. Horri esker, lehen bilagaian zehaztu den lema edo formaren ondoren gehienez halako distantziara dagoen kategoria jakin bateko hitzak bila daitezke; esaterako, lema edo forma jakin baten ondoren (demagun, azido) dauden adjektiboak bila daitezke.
12. irudia. Bilaketa aurreratuaren bilaketa-atala: bilagai anitz sartzeko aukera.
Gainera, bigarren edo hirugarren bilagaia sartzen bada, beste aukera batzuk bistaratzen dira: hain zuzen ere, 'Eremua', 'Generoa' eta 'Urtea' kenduta (datu horiek obrari baitagozkio), gainerakoetan aukera dago dagokion datua lehen, bigarren edo hirugarren bilagaiaren arabera eskuratzeko.
Eremu honetan ez dago murrizketarik nahi beste parametro aukeratzeko. Letra larrien tekla sakatuta, ondoz ondoko parametro-segida bat hauta dezakegu; kontrol-tekla sakatuta, nahi dituzun parametroak hauta ditzakezu, elkarren ondokoak ez izan arren.
Bilaketa-atalean bilagai bat baino gehiago erabili dugunean, Kopuruak eremuan aukera berriak ditugu:
Gehienez eremuaren helburua da tauletan zenbat emaitza bistaratuko diren zehaztea, edo irizpide batzuen arabera mugatzea. Hauek dira aukerak:
% aukera hautatuz gero, emaitzen taulan item bakoitzak gainerako emaitzekiko duen maiztasun erlatiboa agertzen da. Esaterako, lema baten erabilera eremuaren arabera nola banatzen den aztertu nahi badugu.
13. irudia. protozoo terminoaren banaketa eremuaren arabera.
Funtsean, emaitza-atalaren ezaugarri nagusiak bilaketa arruntean azaldu ditugunak dira. Orain aukera dugu kopuruak bakarrik bistaratzeko, edo testuinguruak besterik ez, baita biak batera ikusteko ere. Bestetik, azaldu berri dugu Kopuruak laukian aukera gehiago ditugula bilaketa aurreratuan. Adibide batzuen bidez jabetuko gara hobeto horien baliagarritasunaz:
14. irudia. argi lemaren formen eta kategorien banaketa.
15. irudia. ingurugiro eta ingurumen terminoen maiztasunak urtearen arabera.
16. irudia. integratu aditzaren Teknologia eremuko agerraldiak.
17. irudia. azido-ren ondoan agertzen diren adjektiboak.
18. irudia energia hitzaren aurreko eta ondorengo izenen maiztasunak, marraz lotuak zein gabeak (Osagaietan aukeraren erabilera)
Bilaketa arruntean bezala, aurkitutako agerraldiaren gainean sagua pausatuz, agerraldi horren analisiaren emaitza bistaratzen da (lema kategoria). Automatikoki prozesatu diren testu-hitzen kasuan, gerta daiteke anbiguoak izatea, hau da analisi bat baino gehiago onartzea. Esaterako, hartzen testu-hitza hartu aditzaren forma izan daiteke (aspektu burutugabea), edo hartz izenarena (hartz + -en). Analisi guztiak bistaratzen dira, eta desanbiguazio automatikoan probableentzat jo dena letra lodiz ikusiko duzu. Esaterako, hurrengo adibidean desanbiguatzaile automatikoak hartu aditza analisia hobetsi du (baita asmatu ere).
19. irudia. hartu-ren agerraldi batzuk, ziurtasun-maila desberdinekoak.
Zergatik ageri da orduan hartzen horiz nabarmenduta? Horra azalpena:
20. irudia. hartz-en agerraldi ez-ziurrak.
Azken hiru aukerak Non laukiaren balioa 'Corpus osoan' denean soilik bistaratzen dira. Dena den, ezkerraldeko emaitza-atalean kopuruak ez dira lau taulatan antolatzen, bitan baizik: