vorige sectie Inhoud van dit hoofdstuk Hoofdindex


9.5 Psychofysische schalen

Er zijn een aantal schalen in gebruik waarmee getracht wordt een relatie uit te drukken tussen de fysieke kenmerken van een signaal enerzijds, en de perceptieve equivalenten daarvan anderzijds. Dat dergelijke schalen nodig zijn, is duidelijk: het verschil tussen twee tonen van bijvoorbeeld 4.000 en 4.005 Hz wordt als geringer waargenomen dan dat tussen twee tonen van 100 en 105 Hz. Het gehoor blijkt bij hogere frequenties steeds minder goed in staat signalen van verschillende frequenties te onderscheiden. Perceptieve schalen voor fysieke eigenschappen van signalen heeft men langs twee wegen verkregen.

De eerste bestaat erin dat men luisteraars opdraagt om tonen b.v. 'half zo hoog' of 'twee keer zo hoog' in te stellen als een referentietoon. Wanneer we b.v. een toon willen verkrijgen die twee keer zo hoog klinkt als een referentietoon van 1.000 Hz, dan moet de frequentie van de instelbare toon geen 2.000 maar ca. 3.000 Hz bedragen. De mel-schaal is op deze wijze geconstrueerd, met als uitgangspunt 1.000 Hz = 1.000 mel. De claim bij deze schaal is dat verdubbeling van het aantal eenheden ook verdubbeling van de toonhoogte betekent: een toon van 2.000 mel klinkt twee maal zo hoog als een toon van 1.000 mel. Let wel, het gaat hierbij om enkelvoudige sinustonen.
vraag
Een verwante schaal is de semitoonschaal, die meer gerelateerd is aan de muziekwaarneming. Daarbij gaat men uit van een relatie tussen frequenties uitgedrukt in Hz en schaalwaarden die die frequenties omzetten in octaven (verdubbelingen van de frequentie) en onderdelen daarvan (12 semitonen = 1 octaaf). De semitoonschaal is logaritmisch: semitonen en de bijbehorende hertz-getallen zijn aan elkaar gerelateerd volgens de functie st = 39,86 x log(Hz/basisfrequentie); de basisfrequentie wordt vaak op 50 Hz gesteld, overeenkomend met ongeveer de laagste grondfrequentie die een spreker kan realiseren. Het verschil tussen 50 en 100 Hz bedraagt zo 39,86 x log 2 = 12 st.

De tweede benadering is van meer fundamentele aard; hij is gebaseerd op de aanname dat het gehoor bestaat uit een serie bandpass filters, d.w.z. filters die zijn afgestemd op een centrumfrequentie en die signalen steeds meer verzwakken naarmate zij verder afwijken van die middenfrequentie. De bandbreedte van die filters neemt, bij hogere frequenties, toe, en daarmee neemt de nauwkeurigheid van de frequentiewaarneming af.

Er zijn twee toonhoogteschalen in gebruik die gerelateerd zijn aan het concept van de kritieke band (§ 9.4.1): de Bark-schaal en de schaal van de Equivalent Rectangular Bandwidth (ERB). Beide lijken op elkaar, maar de laatstgenoemde heeft vooral in de lagere frequentieregionen kleinere bandbreedtes.

De semitoon- en de ERB-schaal worden met name gebruikt bij intonatieonderzoek, waar het gaat om een goede afbeelding van de grondfrequentie op een perceptieve schaal. De ERB-schaal geniet tegenwoordig het voordeel, in ieder geval voor zover het intonatietalen betreft (Hermes & van Gestel, 1991); voor registertoontalen (§ 10.2.1), waar de toonhoogte meer sprongsgewijs stijgt en daalt, verdient de semitoonschaal mogelijk nog steeds de voorkeur. De mel- en vooral de Bark-schaal worden gebruikt om formantfrequenties perceptief realistisch te schalen (zie fig. 9.8). Merk op dat de alternatieve schalen elkaar nauwelijks ontlopen. Voor formules die hertz-frequenties omzetten in de diverse genoemde schaalwaarden en vice versa verwijzen we naar appendix A.
fig9-8.jpg
Fig. 9.8 A: semitoon- en ERB-waarden als functie van frequentie in Hz, bruikbaar voor de perceptieve schaling van grondfrequentie van spraakgeluid. B: mel- en Bark-waarden als functie van frequentie in Hz, bruikbaar voor perceptieve schaling van formantfrequentie.


vorige sectie Inhoud van dit hoofdstuk Hoofdindex
zeglwit.gif

Copyright © 1998 Coutinho
Alle Rechten Voorbehouden