ANW-artikel

(Sorry, this page is only available in Dutch. You can try Google Translate:

Gewone artikelen en koepelartikelen

Het merendeel van de artikelen in het ANW bestaat uit “gewone artikelen”, d.w.z. artikelen waarin u alle betekenissen van een woord opgesomd vindt, liefst in een zo eenvoudig mogelijke structuur, met twee structuurlagen: kernbetekenissen en subbetekenissen.

Het ANW is een synchroon woordenboek. Dat betekent dat woorden met dezelfde vorm, maar een verschillende etymologische herkomst samen in één artikel behandeld worden, ongeacht of ze etymologisch gezien dezelfde herkomst hebben.

Soms is het vormelijke of semantische verschil tussen de woorden echter zo groot dat de behandelde woorden in één artikel wél onderscheiden worden door zogeheten “koepels”. De redacteur kan een ‘overkoepeling’ aanbrengen, waarbij hij globaal betekenis en/of woordsoort kan aangeven. Onder die ‘koepel’ bevat het formulier bij een koepelartikel verder dezelfde categorieën en subcategorieën als bij het normale artikel. Het koepelartikel wordt bijvoorbeeld benut als woorden een verschillende woordsoort hebben (bv. bij = substantief (dier), voorzetsel en bijwoord; do = substantief (muzieknoot) en afkorting (voor o.a. donderdag)) of als eigennamen en soortnamen in één artikel behandeld worden (bv. Pers/pers).

In het ANW zijn de verschillende onderdelen van een koepelartikel gemarkeerd door hoofdletters: A, B, C enz.

Een ANW-artikel

Een artikel in het Algemeen Nederlands Woordenboek (ANW) bestaat uit de volgende onderdelen:

  1. Lemma
  2. Betekenis en gebruik

en een kadertje rechts op het scherm met informatie over:

  • Woordsoort
  • Spelling en flexie
  • Woordrelaties
  • Woordvorming
  • Uitspraak

1) Lemma

Als eerste wordt de lemmavorm getoond. Als er meerdere lemmavormen zijn, worden deze door een slash (/) gescheiden. Voorbeeld: ma/MA/Ma/mA.

2) Betekenis en gebruik

Het onderdeel betekenis en gebruik vormt het hart van een ANW-artikel. Betekenissen zijn verdeeld in hoofd- en subbetekenissen die genummerd zijn. Per betekenis worden de volgende informatiecategorieën onderscheiden:

  • Definitie
  • Bijzonderheden gebruik
  • Multimedia
  • Betekenisbetrekking
  • Semagram (extra betekenisinformatie)
  • Voorbeelden
  • Combinatiemogelijkheden
  • Vaste verbindingen
  • Spreekwoorden
  • Woordfamilie
  • Etymologie

Definitie

Het veld definitie bevat de definitie van het behandelde trefwoord. In afwijking van wat in de lexicografie gebruikelijk was, wordt in het ANW in de definitie van een overgankelijk werkwoord het object meegedefinieerd.

Restricties

Bij de definitie kunnen aanvullende gegevens staan over de betekenis of het gebruik van het trefwoord: restricties als Gezegd van meisjes (bv. giechelen) of Met betrekking tot boeken (bv. inbinden), opmerkingen over de betekenis die niet in de definitie thuishoren en verwijzingen naar andere woordenboekartikelen. Opgegeven restricties staan direct voor de definitie (tussen haakjes), terwijl opmerkingen en verwijzingen direct onder de definitie staan.

Bijzonderheden gebruik

Onder de genummerde betekenissen van het lemma kunnen gegevens over bijzonderheden gebruik vermeld worden, zoals taalvariëteit, stijl, houding, domein, frequentie, tijd en medium van het betreffende woord.

  • taalvariëteit kan de volgende waardes hebben: (vooral) in België; (vooral) in Nederland; (vooral) in Suriname.
  • stijl kan de volgende waardes hebben: zeer formeel; formeel; informeel; zeer informeel; vulgair; bijbels; religieus; poëtisch/literair; specialistisch.
  • houding kan de volgende waardes hebben: pejoratief (= uitgesproken negatief); eufemistisch (= verbloemend); liefkozend; schertsend; ironisch; sarcastisch; beledigend; kwetsend.
  • domein wordt alleen toegekend aan woorden of verbindingen die op de een of andere manier verbonden zijn met een vaktaal en/of een specifiek gebied uit de samenleving. Indien van toepassing wordt ook een bovenliggend domein gegeven. Bv.: voetbal, balsport.
  • frequentie wordt gebruikt om aan te geven of een lemma weinig of frequent gebruikt wordt.
  • tijd kan de volgende waardes hebben: verouderend; archaïsch; neologisme.
    Het ANW hanteert een ruime opvatting van neologisme: niet alleen nieuwe woorden, maar ook nieuwe verbindingen, nieuwe uitdrukkingen en nieuwe betekenissen van al bestaande woorden. De grens ligt bij het jaar 2000: woorden e.d. die opgetekend zijn voor dat jaar, worden niet als neologisme beschouwd.
  • medium kan de volgende waardes hebben: (vooral) geschreven taal; (vooral) gesproken taal.

Multimedia

Naast de definitie kan een afbeelding getoond worden en/of is een geluidsbestand of een video beschikbaar.

Betekenisbetrekking

De betekenisrelaties tussen verschillende betekenissen worden getoond in het veld betekenisbetrekking. De waardes zijn: metafoor; metonymie; specialisering; generalisering; onduidelijk.

Semagram (extra betekenisinformatie)

Het ANW onderscheidt zich van alle andere woordenboeken door de opname van een semagram. De geestelijke vader van het semagram, oud-hoofdredacteur prof. dr. Fons Moerdijk, heeft het semagram als volgt omschreven:

“Een semagram is de weergave van met een woord te verbinden kennisgegevens in een frame met ‘slots’ en ‘fillers’. ‘Slots’ zijn conceptuele-structuurelementen die kenmerken en relaties noemen die gelden voor de betekenisklasse waartoe een woord behoort (bv. KLEUR, GEUR, SMAAK, SAMENSTELLING, GRONDSTOFFEN, BEREIDING voor de klasse van de drankbenamingen)."

Het semagram bevat dus alle voor de woordklasse relevante (vaak ook encyclopedische) gegevens over het beschreven woord. Het semagram is eigenlijk een uitvoerige biografie van het woord in kwestie en biedt veel meer informatie dan een definitie kan doen.

Bovenin het semagram wordt met een aanloopzinnetje ingevuld tot welke klasse het betreffende woord wordt gerekend. Bv. bij ambtenaar wordt vermeld: is een persoon; bij modereren staat: is een handeling of een gebeurtenis. Eventuele bovenliggende klassen worden ook gegeven. Zo staat bij bier: is een drank; is een vloeistof; is een stof.

Onder het semagram kan een link staan naar een gerelateerd semagram. Bv. bij synoniemen van alcoholicus naar alcoholist en bij hyperoniemen van belastingambtenaar naar ambtenaar. Bij hyperoniemen worden de algemene kenmerken in het semagram van het hyperoniem vermeld en worden alleen de afwijkende kenmerken vermeld bij het hyponiem.

Het belangrijkste onderdeel van het semagram zijn de kenmerken. In het ANW wordt een zeer gedetailleerde set van kenmerken gebruikt, o.a. afmeting, dimensie; geluid; geur; gevoelsindruk; kleur; lichtreflectie; omvang concreet; smaak; transparantie; uiterlijk; vorm; waarneembaarheid.

Semagrammen worden vooral gegeven bij substantieven: vooral woorden met een relatief hoge frequentie en bij voorkeur grondwoorden. Naar bevind van zaken kan van deze richtlijn afgeweken worden.

Naast de hierboven beschreven kenmerken is er voor wetenschappelijke, technische termen en woorden uit de flora en fauna een aparte categorie wetenschap, waarin de volgende kenmerken kunnen worden ingevuld (en waarbij geen “aanloopzinnetjes" worden gebruikt): wetenschappelijke naam; rijk; stam; klasse; orde; familie; geslacht; soort; atoomnummer; formule; geheel; groep; symbool.

Voorbeelden

In het ANW worden bijna altijd voorbeelden opgenomen van het woord, in vrij gebruik of in combinaties, vaste verbindingen e.d. Dat zijn in de regel voorbeelden uit het eigen ANW-corpus, maar het kunnen ook voorbeelden zijn die op internet of, een heel enkele keer, in niet-digitale bronnen gevonden zijn.

In het ANW worden de oorspronkelijke bronteksten zoveel mogelijk intact gelaten, d.w.z. ook als de spelling niet conform de huidige voorschriften is, wordt dat niet verbeterd. Wel wordt er ingegrepen bij “storende” taalfouten (bv. dt-fouten). Alle voorbeeldzinnen eindigen met een punt, en vraagteken, een uitroepteken of met aanhalingstekens sluiten. Uit een aantal voorbeeldzinnen zijn stukjes weggelaten. De reden daarvoor kan zijn:

  • de voorbeeldzin wordt anders te lang;
  • het betreft namen, telefoonnummers of websites;
  • het betreft een bijzin die probleemloos "gemist" kan worden.

Uitgangspunt bij de weglatingen was het intact laten van de voorbeeldfunctie van het citaat. Weglatingen worden weergegeven door vierkante haken met drie puntjes ertussen ([…]) gevolgd door het leesteken dat voor het vervolg van de voorbeeldzin staat.

Krantenkoppen in een voorbeeldzin zijn voorzien van een slotpunt en plaatsnamen (die vaak volgen na de krantenkop) zijn weggelaten zonder […]. De tekstopmaak van de bron is niet gehandhaafd.

De datering van een voorbeeldzin kent drie vormen:

  • alleen het jaar
  • maand (voluit geschreven) en jaar
  • datum, maand (voluit geschreven) en jaar

Veel voorbeeldzinnen zijn ongedateerd. Dit betreft dan vooral internetbronnen. Namen van auteurs en de brontitels zijn gebaseerd op de ANW-bronnenlijst.

Combinatiemogelijkheden

Het ANW onderscheidt zich niet alleen van andere woordenboeken door zijn semagrammen, maar ook door zijn aandacht voor de combinatiemogelijkheden van woorden. Er wordt onderscheid gemaakt tussen combinatiemogelijkheden en vaste verbindingen. Bij combinatiemogelijkheden gaat het erom de patronen vast te leggen en te presenteren, de syntactische combinatiemogelijkheden te tonen die zich bij een woord voordoen. In de praktijk gaat het hier vooral om zeer vertrouwde/conventionele vrije verbindingen en (lexicale en grammaticale) collocaties. Bij verbindingen draait het om twee hoofdgroepen: vaste, idiomatische verbindingen (de betekenis van een gehele combinatie is niet uit zijn bestanddelen te herleiden) of combinatiemogelijkheden die in hun vorm een gevestigd formuleachtig karakter hebben (met genoegen, tot ziens).

Combinatiemogelijkheden worden onderscheiden naar type: substantief; werkwoord; adjectief; bijwoord; voornaamwoord; telwoord; overig.

Bij substantief: als object bij een werkwoord; als subject bij een werkwoord; met adjectief ervoor; met adjectivisch tegenwoordig deelwoord; met adjectivisch voltooid deelwoord; met voorzetselgroep; in voorzetselgroep; in voorzetselgroep met werkwoord; in voorzetselgroep met werkwoord gevolgd door voorzetselgroep; als object bij werkwoord met vast voorzetsel; in voorzetselgroep met werkwoord en vast voorzetsel; met substantief ervoor; met substantief erachter; met telwoord ervoor; met telwoord erachter; met adjectief erachter; met infinitief met te; met infinitief met om te; met dat-zin; met vraagzin; met of-zin; met alsof-zin; met aanwijzend voornaamwoord; met bezittelijk voornaamwoord; met onbepaald voornaamwoord; met persoonlijk voornaamwoord; voorafgegaan door naamvalsgenitief; gevolgd door naamvalsgenitief; met eigennaam; met lidwoord; met ander nevengeschikt substantief; overige.

Bij werkwoord: met subject; met object; met object en substantief; met object en adjectief; met object en bijwoord; met object en substantief indirect object; met object en indirect object met aan; met object en vast voorzetsel; met object en als-bepaling; met indirect object; met indirect object met aan; met voorzetselgroep; met bijwoord; met ondervindend voorwerp; met adjectief; met infinitief; met een infinitief met te; met een infinitief met om te; met een dat-zin; met een vraagzin; met een of-zin; met een alsof-zin; met een als-bepaling; in voorzetselgroep met aan het; in voorzetselgroep met uit; met directe rede; met substantief = inherent object; met ander, nevengeschikt werkwoord; overig.

Bij adjectief: met substantief; met bijwoord; met werkwoord; met voorzetselgroep; met infinitief met te; met infinitief met om te; met dat-zin; met of-zin; met verplicht object; met ander, nevengeschikt adjectief; overig.

Bij bijwoord, voornaamwoord en telwoord: met substantief ervoor: met substantief erachter; met adjectief ervoor; met adjectief erachter; met bijwoord; met werkwoord; met voorzetselgroep; met telwoord; met voornaamwoord; met voltooid deelwoord; met tegenwoordig deelwoord; met infinitief met te; met infinitief met om te; met dat-zin; overig.

Per combinatietype worden een of meerdere voorbeelden gegeven.

Vaste verbindingen

Onder vaste verbindingen verstaat het ANW vaste, idiomatische verbindingen (de betekenis van een gehele combinatie is niet uit zijn bestanddelen te herleiden) of combinaties die in hun vorm een gevestigd formuleachtig karakter hebben (met genoegen, tot ziens). Er wordt dus onderscheid gemaakt tussen combinatiemogelijkheden en vaste verbindingen. In tegenstelling tot combinatiemogelijkheden hebben vaste verbindingen wel een betekenisomschrijving.

Spreekwoorden

Bij spreekwoorden gaat het om volledige zinnen in een min of meer vaste vorm die een bepaalde levenswijsheid verkondigen. Net als bij vaste verbindingen wordt bij spreekwoorden een betekenis gegeven.

Woordfamilie

In het veld Woordfamilie worden de woorden opgesomd die tot de woordfamilie van het trefwoord behoren, waarbij de volgende velden onderscheiden worden:

  • afleidingen (bv. ambtenaarschap, ambtenaartje, ambtenarendom, ambtenares bij ambtenaar)
  • samenstellingen met het trefwoord als rechterlid (bv. beleidsambtenaar, belastingambtenaar, bestuursambtenaar bij ambtenaar)
  • samenstellingen met het trefwoord als linkerlid (bv. ambtenarenactie, ambtenarenakkoord, ambtenarenapparaat bij ambtenaar)
  • samenstellende afleidingen (bv. beitelvormig bij beitel, dolkvormig bij dolk, petroleumkleurig bij petroleum)
  • samenstellende samenstelling (= woord waarbij door samenstelling met een rechterlid twee woorden verbonden worden tot één linkerlid, bv. tweepersoonsbed, groothoeklens)
  • overige

Daarnaast zijn er de velden ‘Uitheemse woordreeks’ voor woorden met dezelfde wortel en ‘Reekshoofd’, voor het uitgangswoord in zo’n reeks (bv. demonstreren, demonstratie, demonstrant, demonstrante, demonstratief, reekshoofd: demonstreren).

Eventueel kunnen ook overige woordfamilieleden worden vermeld.

Etymologie

Omdat het ANW een synchroon woordenboek is, wordt bij de opgenomen woorden in beginsel geen etymologie gegeven. Wel kan de herkomst van een woord d.m.v. een link in het linkerframe opgezocht worden in de woordenboeken van het Instituut voor de Nederlandse Taal: het Oudnederlands Woordenboek (ONW), het Vroegmiddelnederlands Woordenboek (VMNW), het Middelnederlandsch Woordenboek (MNW) en het Woordenboek der Nederlandsche Taal (WNT). In het kader rechts kan in de Etymologiebank nagezocht worden of het betreffende woord behandeld is in de etymologische woordenboeken.

Etymologische en encyclopedische informatie kan ook nagezocht worden in de internetencyclopedie Wikipedia. Als een artikel uit het ANW eenmaal geopend is, volstaat klikken op de link naar Wikipedia om direct in het betreffende artikel terecht te komen. Hetzelfde geldt voor de link naar Google: als een ANW-artikel eenmaal geopend is, kan met een klik met de zoekmachine Google gezocht worden met het betreffende woord als trefwoord.

Voor neologismen wordt in het ANW een uitzondering gemaakt. Deze worden voorzien van etymologische informatie omdat we ze bij wijze van spreken onder onze ogen zien ontstaan en de gegevens ervan zo zonder veel moeite zo nauwgezet mogelijk vast zijn te leggen. De categorie etymologie bevat de volgende velden en subvelden:

  • aard herkomst (subcategorieën: inheems woord; leenwoord; leenwoordgroep; leenvertaling; leenbetekenis; inheems of leenwoord; inheems of leenvertaling; inheems of leenbetekenis; onzeker; onbekend)
  • vroegste datering
  • periode opkomst
  • omstandigheden opkomst
  • omstandigheden verdwijnen
  • ontlening (subcategorieën: brontaal; vorm in brontaal; betekenis in brontaal; datering in brontaal)
  • bedenker
  • benoemingsmotief
  • externe verwanten (subcategorieën: externe verwanten; taal; vorm; betekenis)
  • bijzonderheden

Kader rechts

Voor iedere betekenis wordt rechts op het scherm in een kadertje de volgende informatie getoond:

  1. Woordsoort
  2. Spelling en flexie
  3. Woordrelaties
  4. Woordvorming
  5. Uitspraak

1) Woordsoort

De volgende woordsoorttypes worden onderscheiden: substantief, werkwoord, adjectief, lidwoord, voornaamwoord, telwoord, bijwoord, voorzetsel, voegwoord, tussenwerpsel. De verschillende types hebben ieder een eigen structuur:

a) bij substantief worden gegevens vermeld over:

  • betekenisklasse (persoonsnaam; diernaam; plantnaam; zaaknaam; stofnaam; verzamelnaam; abstractum; eigennaam)
  • getal (geen meervoud; geen enkelvoud; met meervoud; enkelvoud, soms ook met meervoud; met enkelvoud; meervoud, soms ook met enkelvoud)
  • lidwoord (de; het; de of het; geen)
  • geslacht (mannelijk; vrouwelijk; onzijdig; mannelijk of vrouwelijk; mannelijk of onzijdig; vrouwelijk of onzijdig; mannelijk, vrouwelijk of onzijdig)
  • vormen (enkelvoud; meervoud, verkleiningsvorm)
  • naamtype (soortnaam; eigennaam)

b) bij werkwoord worden gegevens vermeld over:

  • functie (zelfstandig werkwoord; hulpwerkwoord; koppelwerkwoord)
  • syntactische subklasse (overgankelijk (= werkwoord met een object); onovergankelijk (= werkwoord zonder object); overgankelijk en onovergankelijk; overgankelijk en noodzakelijk wederkerend; onovergankelijk en noodzakelijk wederkerend (bv. zich vergissen); overgankelijk of overgankelijk een noodzakelijk wederkerend; onovergankelijk of onovergankelijk en noodzakelijk wederkerend; overige)
    NB: bij toevallig wederkerende werkwoorden (bv. zich wassen) kan het wederkerend voornaamwoord door een ander lijdend voorwerp vervangen worden. In het ANW worden die werkwoorden dan ook gewoon als ‘overgankelijk’ bestempeld.
  • aard subject (onpersoonlijk)
  • vervoeging (regelmatig/zwak; onregelmatig/sterk; regelmatig en half onregelmatig; regelmatig en onregelmatig)
  • vormen (infinitief (= het hele werkwoord); eerste persoon o.t.t. (bv. loop), tweede persoon o.t.t. (bv. loopt); derde persoon o.t.t. (bv. loopt); meervoud o.t.t. (bv. lopen); enkelvoud o.v.t. (bv. liep); meervoud o.v.t. (bv. liepen); tegenwoordig deelwoord (bv. lopend); voltooid deelwoord (bv. gelopen)). Verder wordt bij Hulpwerkwoord aangegeven of het werkwoord voorkomt met zijn, hebben of dat beide mogelijkheden kunnen.

c) bij adjectief worden gegevens vermeld over:

  • syntactische subklasse (attributief, soms ook predicatief; attributief en predicatief; attributief, predicatief en bijwoordelijk; attributief en bijwoordelijk; attributief; predicatief; bijwoordelijk; zelfstandig)
  • vormen (stellende trap onverbogen (bv. dik); stellende trap verbogen (bv. dikke); vergrotende trap onverbogen (bv. dikker); vergrotende trap verbogen (bv. dikkere); overtreffende trap onverbogen (bv. dikst); overtreffende trap verbogen (bv. dikste); zelfstandig gebruik op -s (bv. diks))

d) bij lidwoord worden gegevens vermeld over:

  • soort (lidwoord van bepaaldheid (= de, het); lidwoord van onbepaaldheid (= een)

e) bij voornaamwoord worden gegevens vermeld over:

  • soort (persoonlijk voornaamwoord; wederkerend voornaamwoord (bv. zich); wederkerig voornaamwoord (bv. elkaar); bezittelijk voornaamwoord; aanwijzend voornaamwoord; vragend voornaamwoord; betrekkelijk voornaamwoord; onbepaald voornaamwoord; uitroepend voornaamwoord)
  • persoon (eerste persoon; tweede persoon; derde persoon)
  • vormen (subjectsvorm; objectsvorm)

f) bij telwoord worden gegevens vermeld over:

  • soort (bepaald hoofdtelwoord; onbepaald hoofdtelwoord; rangtelwoord; breukgetal)
  • vormen

g) als bijwoord is ingevuld, wordt een structuur zichtbaar met de volgende velden:

  • naar de vorm (voorzetselbijwoord; voornaamwoordelijk bijwoord; overig)
  • naar de betekenis (bijwoord van plaats of richting; bijwoord van tijd; bijwoord van frequentie; bijwoord van graad; kwantificerend bijwoord; bijwoord van hoedanigheid; bijwoord van modaliteit; oordeelspartikel; bijwoord van ontkenning; voegwoordelijk bijwoord)
  • naar de functie (noemend bijwoord; aanwijzend bijwoord; onbepaald bijwoord; vragend bijwoord; betrekkelijk bijwoord)

h) bij voorzetsel worden gegevens vermeld over:

  • soort (achtergeplaatst voorzetsel; voorzetselcombinatiepatroon; voorzetseluitdrukking)

i) bij voegwoord worden gegevens vermeld over:

  • soort (nevenschikkend (bv. en); onderschikkend (bv. omdat))

    * als “nevenschikkend” is ingevuld, kan een keuze worden gemaakt uit de waardes: aaneenschakelend; tegenstellend; causaliteit aanduidend; gevolgaanduidend

    * als “onderschikkend” is ingevuld, kan een keuze worden gemaakt uit de waardes: grammatisch verbindend; van tijd; van causaliteit; van gevolg; van graadaanduidend gevolg; van doel; voorwaardelijk; van toegeving; van omstandigheid; beperkend; uitbreidend; van verhouding; van vergelijking; van modaliteit

j) bij tussenwerpsel worden geen aanvullende gegevens vermeld.

2) Spelling en flexie

Onder spelling worden vermeld: de afbreking van de lemmavorm, de afbreking van de flexievormen (bv. de verbogen vorm van het bijvoeglijk naamwoord, het meervoud van een zelfstandig naamwoord, het voltooid deelwoord van een werkwoord), en, indien van toepassing, de gangbare afkorting of het gangbare grafische symbool en al dan niet erkende varianten.

3) Woordrelaties

Het blok woordrelaties bevat de volgende categorieën:

  • hyperoniem
  • synoniem
  • antoniem
  • feminiem
  • androniem

- Een hyperoniem is een woord dat de betekenis van een ander woord insluit, d.w.z. het is het naastgelegen, hogere begrip. Bv.: de biersoorten flessenbier en geuze hebben als hyperoniem bier; het woord bier heeft als hyperoniem drank. De eigennaam Arabier ‘iemand uit Arabië’ heeft als hyperoniemen: persoon; inwoner; bewoner. De soortnaam arabier ‘Arabisch volbloedpaard’ heeft als hyperoniem paard.

- Een synoniem is een woord dat hetzelfde of vrijwel hetzelfde betekent als een ander woord. Sommige taalkundigen betwijfelen of echte synoniemen wel bestaan. Anderen maken onderscheid tussen volsynoniemen (= woorden die precies hetzelfde betekenen) en halfsynoniemen (= woorden die vrijwel hetzelfde betekenen). In het ANW worden in het veld Synoniem in ieder geval de volsynoniemen opgenomen, maar kunnen ook halfsynoniemen vermeld worden. Bv.: absent heeft als synoniem afwezig.

- Een antoniem is een woord met een tegengestelde betekenis. Bv. absent heeft als antoniemen: present en aanwezig; amateurfotograaf heeft als antoniem: beroepsfotograaf.

- Een feminiem is de vrouwelijke variant van een woord. Bv.: alcoholiste is het feminiem van alcoholist, Belgische is het feminiem van Belg, dichteres is het feminiem van dichter, promovenda is het feminiem van promovendus.

- Een androniem is de mannelijk variant van een woord. Bv.: alcoholist is het androniem van alcoholiste, Belg is het androniem van Belgische, dichter is het androniem van dichteres, promovendus is het androniem van promovenda.

4) Woordvorming

Onder woordvorming wordt aangegeven hoe het lemma gevormd is. De volgende gevallen worden onderscheiden:

  • a) ongeleed, bijvoorbeeld aap, bok, das, detective, miljard, school.
  • b) afleiding (met subvelden waarin onder meer de basisvorm, het voorvoegsel of achtervoegsel beschreven worden), bijvoorbeeld aansteker, absurdisme, accentloos, ADHD’er, flipper, godin, hypnotiseren, omroepster, presentator, zaterdags.
  • c) afleiding door prefixsubstitutie
  • d) afleiding door suffixsubstitutie, bijvoorbeeld carjacken en excommuniceren.
  • e) samenstellingen (met subvelden voor het linkerlid, het rechterlid, het samenstellingstype en de verbindingsklank), bijvoorbeeld badpak, brulaap, maar ook adware, boerkini e.d.
  • f) samenkoppeling (met subvelden voor het linkerlid, het rechterlid en het type), bijvoorbeeld afborstelen, hogeschool, president-directeur.
  • g) samenstellende afleiding (met subvelden voor het linkerdeel, het middendeel, het achtervoegsel en het type), bijvoorbeeld achthoekig, amandelvormig, donkerharig.
  • h) samenstellende samenstelling (met subvelden voor het linkerdeel, het middendeel, het rechterdeel en het type), bijvoorbeeld anticonceptiemiddel, langpootmug, zelfscankassa.
  • i) blend (met subvelden voor de bestanddelen en de basiswoorden), bijvoorbeeld infobesitas, lijger, preferendum.
  • j) verkorting (met subvelden voor basis en type), bijvoorbeeld agnost, aso, choco.
  • k) keervorming (met een subveld basis). Onder keervorming verstaat het ANW wat in de taalkundige literatuur ook bekendstaat als Rückbildung of back formation.
  • l) letterwoord (met het subveld basis), bijvoorbeeld aids, bios, NATO.
  • m) initiaalwoord (met het subveld basis), bijvoorbeeld apk, cao, CBR, EHBO.
  • n) lettergreepwoord (met het subveld basis), bijvoorbeeld horeca, romkom.
  • o) afkorting (met het subveld basis), bijvoorbeeld a.h.w., i.p.v., o.a., w.v.t.t.k.
  • p) vormelijk geleed, bijvoorbeeld burgemeester, dinges, eekhoorn.
  • q) gelexicaliseerde woordgroep, bijvoorbeeld ad hoc, bloody mary, less is more.
  • r) voltooid deelwoord als adjectief
  • s) tegenwoordig deelwoord als adjectief
  • t) in brontaal geleed
  • u) overige

Het is mogelijk dat een lemmawoord een meervoudige woordvorming toegekend krijgt, bijvoorbeeld wanneer iets zowel een samenstelling als een samenstellende afleiding kan zijn of wanneer niet uit te maken valt of een woord samengesteld is uit substantief + substantief of werkwoordstam + substantief. Ook als een woord in het Nederlands ongeleed is, maar in de brontaal geleed, kan het lemma een meervoudige woordvorming krijgen, in dit geval zowel het predicaat “ongeleed” als “in brontaal geleed”.

5) Uitspraak

Onder uitspraak wordt aangegeven hoeveel lettergrepen de lemmavorm heeft, waar de hoofdklemtoon ligt, hoe het woord wordt uitgesproken (Engels, Frans, Duits, Italiaans, Spaans, Nederlands en Engels, Nederlands en Frans, Nederlands en Duits, Nederlands en Italiaans, Nederlands en Spaans).

Daarnaast is er een veld voor de fonetische schrijfwijze.

In juni 2015 zijn ruim 94.000 woorden in de ANW-database voorzien van een fonetische transcriptie, waarvan een groot aantal nu al online te zien is. De transcripties zijn automatisch gegenereerd door ReadSpeaker en waar nodig handmatig gecorrigeerd. De gebruikte foneemset is een afleiding van IPA (International Phonetic Alphabet).

Foneemset

Medeklinkers Klinkers/tweeklanken Niet-inheems
Symbool Voorbeeld Symbool Voorbeeld Symbool Voorbeeld
p pen ɪ pit ɑː far
b biet i vier æ cat
t tak i: analyse/creep θ think
d dak ʏ put ð these
k kat y fuut ɹ right
ɡ goal ɛ pet right
m mens beet ɜː player
n nek ə de u: you
ŋ eng øː neus ɔ̃ bon
n j oranje ɑ pat/van ɑ̃ vivant
f fiets baad ɛ̃ l(i)ngerie
v oven ɔ rosse w water
s sok boot ɔɪ boy
z zeep u hoed ʁ tres bien
ʃ chef ɛɪ bijt ʌ nut
ʒ jury œy buit lay
x acht ɑu nauw power
ɣ gaan ʏ: freule
r rat ɛː barrière
h hoed ɔː roze
w wang ɪ pit
j ja
l land
t͡ʃ Tsjechisch
d͡ʒ John

Overige tekens

SymboolVoorbeeld
Hoofdklemtoon*[ *d r oː x ]
Nevenklemtoon '[ *d r oː x - b u . 'k ɛ t ]
Samenstellingsgrens-[ *d r oː x - 'b l u m ]
Syllabegrens.[ *d r oː . m ə n ]
Woordgrens|[ *n ɑ . t j ə | *ɛ n | *d r oː x . j ə ]

Toelichting

De transcripties geven een voorbeeld van de uitspraak van het woord. Er zijn vaak meerdere varianten mogelijk, bijvoorbeeld [ *ɑu . t oː ] en [ *oː . t oː ]. In het ANW wordt vooralsnog in ieder geval één van de uitspraakmogelijkheden weergegeven.

ReadSpeaker maakt tekst-naar-spraaktoepassingen en werkt daarom pragmatisch: de woorden zijn zo getranscribeerd dat de uitspraak van de tekst-naar-spraaktoepassing goed klinkt. Het kan daarom voorkomen dat uitspraakprocessen zoals assimilatie niet overal consequent zijn weergegeven in de transcripties. Enkele andere opmerkingen:

  • Bij samenstellingen (compound) staat er een streepje tussen de morfologische delen, en elk onderdeel van de samenstelling krijgt klemtoon toegekend.
  • Engelse woorden zijn vaak met Engelse symbolen getranscribeerd.
  • De transcripties bevatten geen overgangsklanken zoals bijvoorbeeld in radio [ *r aː . d i . oː ] i.p.v. [ *r aː . d i . j oː ] en oase [ oː . *aː . z ə ] i.p.v. [ oː . *w aː . z ə ].
  • De slot-n is niet overal getranscribeerd omdat die in praktijk vaak wegvalt: hebbe(n), geve(n).
  • In sommige gevallen is er sprake van resyllabificatie (de (lexicale) lettergreepstructuur wordt opnieuw (fonologisch) gevormd), bijvoorbeeld [ ɛ . *r aː n ] i.p.v. [ ɛ r . *aː n ] en [ 'ɪ n . t ə . *r ɑ k . s i - p aː . 't r oː n ] i.p.v. [ 'ɪ n . t ə r. * ɑ k . s i - p aː . 't r oː n ].