|
Vaste geleding | Kern-Bepaling
|
Soorten TW |
Algemene regels TW |
Pre- en postcoördinatie |
Relaties tss Termen
|
Tag |
Thesaurus vs TW-systeem | TW-systeem vs Classificatie | LCSH | splitsen van termen in thesauri | node labels | Meertalige Thesauri
Indexeren= bewerkingsproces bij de onderwerpsontsluiting. Het analyseren van de inhoud van een publicatie op de meest karakteriele elementen en het vertalen van die elementen in termen en structuur van een indexsysteem.
Indextaal= verzameling van termen of notaties en de regels voor het gebruiken van de termen en het aangeven van de relaties tussen de termen.
Indeling indextalen

*KM= Knowledge MAnagement
OF

WOORDSYSTEMEN
Geordende (alfabetisch gerangschikt) verzamelingen woorden en woordgroepen die op een bepaalde manier zijn opgebouwd en waarvan de relaties zijn vastgelegd. Begripsinhoud en taal spelen een grote rol.
Twee soorten:
- Thesaurus
Een thesaurus is een gecontroleerde woordenlijst om dingen te beschrijven. De meest complexe variant van een woordenlijst.
Een thesaurus bij Information Retrieval (IR) is een gecontroleerde woordenlijst met relaties. Deze wordt als controlelijst tijdens indexering of voor referentie tijdens zoeken gebruikt. In een thesaurus wordt een specifieke terminologie gehanteerd, zoals voor voorkeurstermen (zoals scope notes, verbrede en vernauwde term en gerelateerde termen) en bijbehorende varianten.
Een thesaurus is opgebouwd volgens bepaalde specifieke normen en dus onmiddellijk herkenbaar aan de vormgeving (uit de tijd van de opkomst van de computer).
Thesauri zijn postcoördinatief, d.w.z. je moet bij het zoeken verschillende termen met elkaar combineren om het gewenste resultaat te bereiken.
Bv. Eric, Mesh, NASA
Chiara onderscheidt vier soorten thesauri die elk verschillen op de assen 'gebruik tijdens zoeken' en 'gebruik tijdens indexering': natuurlijke taal, zoekthesaurus, indexing thesaurus en de klassieke thesaurus. De eenvoudigste is de synoniemenrij. Voorbeeld: David Bowie, David Robert Jones, Ziggy Stardust en The Thin White Duke.
- Trefwoordsysteem
Kunnen een vorm hebben die dicht aanleunt bij die van thesauri of de vorm van een simpele alfabetische lijst. Trefwoordsystemen zijn précoördinatief, d.w.z. combinaties van termen worden vastgelegdin een vaste volgorde door diegene die het trefwoord toekent.
Nadeel: de G moet op de hoogte zijn van de combinatievolgorde van de gebruikte TW.
Bv. VLACC
THESAURUS vs TREFWOORDSYSTEEM
thesaurus |
trefwoordsysteem |
postcoördinatief |
précoördinatief |
vooral enkelvoudige termen, geen gelede termen |
veel samengestelde termen |
fijne, complexere relaties tss. termen |
relaties tss. termen zijn niet uitgebreid |
(meestal) specifiek kennisdomein |
kan universeel zijn |
bedoeld voor geautomatiseerde domeinen |
bedoeld voor manuele systemen |
relatief gespecialiseerd |
relatief eenvoudig |
moeilijk te onderhouden, vergt veel overleg+adm. |
relatief gemakkelijk te onderhouden |
ook meertalig |
meestal ééntalig |
streng tegenover nieuwe termen |
laat gemakkelijk vorming nieuwe termen toe |
descriptoren |
trefwoorden |
Scope Note (SN) verduidelijkt betekenis descriptor; gebruiksomschrijving |
|
UF= Use For (gelijkheidsterm) |
|
|
|
voordelen: |
|
worden als moderner ervaren |
|
veel beter gedocumenteerd |
|
er is software om ze aan te maken |
|
vaak ook hiërarchisch gestructureerd |
|
kunnen dienen als basis voor taxonomiën |
|
TREFWOORDSYSTEMEN
ONDERSCHEID KERN/OBJECT en BEPALING
KERN: datgene waar de publicatie over gaat: zelfstandig begrip dat niet kan aanzien worden als precisering van een ander zelfstandig begrip binnen het onderwerp.
Bv. geschiedenis van de VS gaat over de VS
auto-industrie in de VS à gaat over auto-industrie
BEPALING: preciseringen bij het object, ze geven aan hoe het onderwerp bekeken wordt.
- In tijd: bv. geschiedenis van de luchtvaart
- in ruimte: bv. architectuur in belgië
- vanuit een bepaald gezichtspunt: bv. een filosofische benadering van de kunst
- vanuit een bepaald kader: bv. wiskunde in het onderwijs
- naar specifieke eigenschappen of hoedanigheden: bv. de snelheid van processoren
- volgens actie/proces: bv. bouwen van huizen
VASTE GELEDING:
- is geen soort TW
- kan autonoom staan bv. sociale aardrijkskunde
- wordt gebruikt bij gelede TW
--> als subgeleding bij een kern/object bv. België; geschiedenis (= vaste geleding)
RELATIES TUSSEN TERMEN (regels om thesaurus te testen)
- Semantische relaties:
gelijkheidsrelaties: voorkeurstermen
- hiërarchische relaties: (alle-sommige toets)
-
generieke (geslacht tov soorten ervan) bv. fietsen-damesfietsen
partitieve (geheel tov delen) bv. België-Vlaanderen
associatieve relaties: inhoudelijk verwant maar niet generiek of partitief
bv. gezondheidszorg-geneeskunde
- Synctactische relaties: tussen woorden en woordgroepen die op zich niet inhoudelijk verwant zijn, maar in de betreffende publicatie met mekaar in verband worden gebracht.
bv. jeugd en criminaliteit
- Verwijzingen tussen termen: dienen op de gebruiker te wijzen op de juiste term of op verwante termen
- semantische verwijzingen
- gelijkheidsrelaties: van de voorkeursterm naar de verwijsterm en omgekeerd (Use en UF)
- hiërarchische: vanuit de bovengeschikte naar de ondergechikte en omgekeerd (Zie ook)
- associatieve (verwijzen naar termen die kunnen helpen bij het zoeken)
- synctactische verwijzingen (komen meer voor bij TW-systemen dan bij thesauri)
Dienen om afzonderlijke woorden en woordgroepen binnen een term toegankelijk te maken.
bv. verwarming
Zie ook: schoolgebouwen; verwarming
SOORTEN TREFWOORDEN
- Enkelvoudige TW: geen BN; werkwoorden vermijden -->ZN
- Samengestelde TW: bestaan uit een combinatie van woorden in een natuurlijk zinsverband
- Gelede TW: bestaan uit woorden in een kunstmatig zinsverband
Combinatievolgorde: Kern/object - Bepaling - Vorm
Volgorde van de bepaling: kader; kenmerk; actie/proces; plaats; tijd; instelling
- Omgezette TW
ALGEMENE REGELS voor het BEPALEN van TW
- Kies specifieke TW; niet te algemeen (te breed) bv. vogels --> wel: kanaries
- Niet meervoudig indexeren bv. mieren ; insecten = niet goed
- Vermijd indirecte TW bv. dieren ; katten --> wel: dieren; zo. katten
(niet naar boven verwijzen, wel zie-ook) bv. wiskunde ; meetkunde
- Vorm moet hanteerbaar zijn; niet meer dan 3 geledingen (max. 2 bepalingen)
-
gemakkelijk kunnen terugkoppelen naar de kern
- natuurlijke taal bv. kunstmatige voeding
- geen omzettingen
bv. geld, zwart --> wel: zwart geld
- Bij meer dan 3 TW --> overkoepelend TW gebruiken
- Bepaling mag geen uitdrukking zijn van iets dat vanzelfsprekend is aan de kern/object; geen opendeuren intrappen
bv. nazi's ; Duitsland
TREFWOORDSYSTEEM vs CLASSIFICATIE
Classificatie |
Trefwoordsysteem |
Deductief |
Inductief |
Vooraf uitgewerkt classificatieschema |
Vertrekt van documenten die in de collectie aanwezig zijn. |
Logische volgorde. Verwante onderwerpen bijeen. |
Geen logische volgorde. Geïsoleerde eenheden: verwante onderwerpen zijn verspreid over het alfabet. (via verwijzingspatroon verbroken band herstellen) |
Sfeerverwerking. Behandeling van het onderwerp vanuit een bepaald gezichtspunt. |
Geen sfeerverwerking. |
Literatuur over een bepaald onderwerp is verdeeld over de verschillende rubrieken. (Alfabetische registratie tracht dit op te lossen.) |
Brengt literatuur over een bepaald onderwerp bijeen. |
Aanpassing aan de evolutie in de wetenschap is moeilijk. |
Aanpassingen aan de evolutie in de wetenschap vrij eenvoudig. (nieuwe trefwoorden zijn gemakkelijk in te lassen) |
Voorkennis van de gebruiker vereist. |
Geen voorkennis van de gebruiker vereist. |
GECONTROLEERDE WOORDENLIJST (CV)
is in feite een lijst van voorkeurstermen met varianten. Het is een deelverzameling van de natuurlijke taal. Een gecontroleerde woordenlijst ('controlled vocabulary' of CV) bestaat uit een bepaalde woordenverzameling voor de beschrijving van content.
De functie van een CV is dat een gebruiker niet over de juiste woorden of terminologie hoeft na te denken. Een CV vervult een brugfunctie tussen het vocabulaire van gebruikers en die in documenten en applicaties. Op veel sites hebben gebruikers zoek- en vindproblemen. De woorden waarmee zij informatie zoeken en proberen te vinden komen vaak niet overeen met de termen en begrippen die in de site of applicatie voorkomen.
CLASSIFICATIES
- Willen documenten ordenen volgens een hiërarchische structuur
- Gericht op ‘browsen’ (grasduinen in de bib), bladeren doorheen de structuur
- Opgebouwd uit kunstmatig gemaakte termen (codes of notaties, soms in comb. met natuurlijke woorden)
- Volgen specifieke regels,.
- Gebaseerd op logische en deductieve indeling van de wetenschappen, van algemeen abstract naar specifiek concreet.
Bv. SISO, UDC
Er bestaan drie classificatiesoorten: opsommende ('enumeratieve'), hiërarchische en facetclassificatie. Voorbeeld van een enumeratieve classificatie van een rode voetbalbal. Binnensporten > speelgoed > rubberen bal. Voorbeeld van een hiërarchische classificatie: spel > speelgoed > bal > voetbal.
Facetclassificatie werd uitgevonden door S.R. Ranganathan (1930). Het is gebaseerd op telkens een enkel onderscheidend indelingsprincipe gebruiken. Fundamentele facetten zijn persoonlijkheid, materie, energie, ruimte en tijd. Dagelijkse facetten zijn onderwerp ('t gaat over...), geografie (waar), auteur (wie), etc. Voorbeeld van een facetclassificatie van de rode voetbalbal: kleur (rood), vorm (rond), materiaal (rubber), omvang (55 cm.), prijs (€ 25,00), fabrikant (Adidas) en type (Teamgeist Match).
VERSCHIL PRECOÖRDINATIE-POSTCOÖRDINATIE
Précoördinatief:
TW zijn op voorhand samengesteld door de indexeerder.
Wanneer een document is ingegeven met verschillende descriptoren kan het resultaat enkel gevonden worden door deze termen in de juiste volgorde in te geven, m.a.w. in de vaste combinatie.
bv. Vubis catalogus
Voordelen=
Vangst: relevante referenties
Nadelen=
Sommige relevante referenties worden niet gevonden.
Postcoördinatief:
De zoeker kan zelf termen combineren, m.a.w. combinaties maken van verschillende descriptoren, waarbij het ingeven van elke descriptor apart of in elke combinatie van 2 of meerdere termen toch het gewenste document opleverd.
bv. thesaurus Ghetty museum
Voordelen=
Grote vangst aan referenties
Nadelen=
Groter aantal minder relevante referenties door woordisolatie of het verbreken van relaties tss. woorden.
Voor- en nadelen van kopiëren van inhoudelijke ontsluiting (Z39.50)
Nadelen:
- Er wordt geen rekening gehouden met bv. indexeerdiepte
- In de overnemende bibliotheek verliest het personeel praktijkervaring in de ontsluiting. In sommige gevallen leidt dit tot volledige afhankelijkheid van de broncatalogus.
- Bij het overnemen uit de verschillende catalogi worden soms verschillende soorten ontsluiting overgenomen.
Voordelen:
- Het is efficiënter, niet elke bibliotheek hoeft zijn eigen ontsluiting te doen.
- Als men uit een catalogus met een hoge kwaliteit overneemt (Vlacc, LC) is de kwaliteit van de ontsluiting gegarandeerd.
tag (metadata)
Een tag (Nederlands: etiket) is een (relevant) sleutelwoord of term geassocieerd met, toegewezen aan of opgenomen in een digitaal bestand (zoals afbeeldingen, video, audio). De tag geeft aanvullende informatie over het bestand waaraan het is gekoppeld en maakt zodoende sleutelwoordgebaseerde classificatie en indexering mogelijk.
Men spreek tvan tagging wanneer gebruikers hun eigen trefwoorden toevoegen aan doc. of aan beschrijvingen van documenten.
Nut:
- persoonlijke informatie beheren
- social bookmarking
- digitale objecten verzmalen en met anderen delen
- e-commerce verbeteren
- allerlei andere redenen bv. Guess-the-google
Voordelen:
- veel mensen vinden het leuk om hun mening te kunnen geven, anderen om dit te lezen
- sociale interactie bv. Facebook
- tags zijn flexibel; met tags kan je bv. ook voorkeur, afkeur, vreugde, ergernis, enz. uitdrukken
- een item behoeft niet meer in 1 klasse te staan (zoals bij classificaties). Tags werken impliciet met facetten
Nadelen:
- tags zijn minder getructureerd dan gecontroleerde vocabulaires, en kunnen daardoor gemakkelijk ontaarden in chaotische toestanden.
- ze zetten ook de deur open voor allerlei misbruiken: scheldwoorden, racisme, gerichte haatcampagnes, enz.
- mensen die taggen houden vaak of weinig rekening met de lezers. Ze gebruiken bv. eigen afkortingen of codes die voor anderen geen betekenis hebben
- tags zijn niet noodezakelijk een uitdrukking van de inhoud. bv. tags bij beschrijvingen van boeken: unread, zolder, tbr, enz.
- internationale sites zijn vaak een kakafonie van allerlei talen
Soorten:
- subject related tags / non-subject related tags
- action related tags / context and workflow related tags
- exclusieve labels / shared labels
- administratieve tags / tags die een vindplaats aangeven / tags die elementen van form. beschrijving weergeven
Gebruik in de bibliotheek: bv. Vlacc gebruikt tags als inhoudelike ontsluiting voor
- gecontroleerde TW
- classificatiecodes (SISO, ZIZI, NUR)
- tags en commentaren uit LybraryThing
- tags en commentaren vaneigen gebruikers
- professionele recensies van Vlabin of Biblion
- tag clouds
Inhoudelijke Ontsluiting:
Plaats geven volgens inhoud
Doeleinden:
- Ordenen van documenten op onderwerp
- Terugvinden naar onderwerp
- Bepalen waarover een document gaat
2 stappen:
- Analyse van de inhoud (kern/object)
- Vertalen van de inhoud:
in termen van de indextaal
in codes van een classificatie
in een samenvatting
LCSH
Library of Congress Subject Headings: is een gestandaardiseerde term uit het onderwerpsregister van de Library of Congress Classification. Deze classificatie is een verfijnd en frequent toegepast classificatiesysteem. Elke vakgebied bestaat uit veel subrubrieken.
De termen zijn aan elkaar gekoppeld --> precoördinatief
SPLITSEN VAN TERMEN
Niet splitsen:
- de opsplitsing leidt tot onduidelijkheid: bv. bloedvaten
- de opsplitsing levert vage termen op: bv. zure regen
- de modifier heeft een andere betekenis in de samengestelde term dan zijn oorspronkelijke betekenis:
bv. spiegelei
- de modifier geeft geen subklasse van de focus aan: bv. teddyberen
- de term is een naam of bevat namen: bv. oedipuscomplex
- de samengestelde term is als dusdanig ingeburgerd: sociale zekerheid
Zeker splitsen:
- de term geeft een onderdeel weer van het geheel: bv. fietswielen
- twee bepalingen preciseren de kern: bv. katoenen sportkleding
- de bepaling drukt het object uit van de transitieve actie weergegeven door de kern: bv. voetverzorging, glas snijden
- de kern drukt een intransitieve actie uit die de bepaling uitvoert: bv. opwarming van de aarde
Node labels:
Knooptermen zijn geen descriptoren, maar worden gebruikt voor het verfijnen van hiërarchische termen.
Ze geven aan wat voor soort termen er gaan volgen; volgens welk criterium de opdeling die volgt gemaakt zal worden.
NTI
- lichaam en delen
- geografische plaatsen
- disciplines
- hiërarchische sociale structuren
MEERTALIGE THESAURI
mogelijkheden:
- exacte gelijkheid: bv. zon / sonne / sun / soleil
- bijna-gelijkheid: bv. jeuw didactuques / learning games
- gedeeltelijke gelijkheid: bv. education / éducation, enseignement, formation
- ongelijkheid: bv. prinsjesdag
standpunten:
- streven naar symmetrie. Kan leiden tot geforceerde opl.,
waarbij woorden uit de ene taal worden overgenomen om ontbrekende woorden in een andere taal aan te vullen of waarbij nieuwe woorden gevonden worden.
- Men accepteere een grote mate van assymmetrie. Dit kan betekenen dat relaties in een ene taal anders zijn, of dat zelfs in de ene taal gesplitst wordt en in de ander niet.
Bibliografie:
Ham, Henk van den (et al.),Werken met trefwoorden : toepassingen bijTrefwoorden : handboek voor opleiding en praktijk. Den Haag, NBLC, 1986
Stuurman, Paul (et al.), Trefwoorden : handboek voor opleiding en praktijk. Den Haag, NBLC, 1989 (1e druk)
Trefwoordenlijst VLACC, Brussel, Ministerie van de Vlaamse gemeenschap, 2000 (2 delen)
Wijnants, G.J. (ed.) en Pontzen, S.A. Th.M. (ed), Woordsystemen : Theorie en praktijk van thesauri en trefwoordsystemen. Den Haag: Biblion, 2000 (2e, herz. druk)
|