Cs. Kádár Péter - XXI. századi Diszkónika, 232. Hangok mintája

Az elektronikus hangszerek, elektronikus kompozíciók hangjainak előállítására nemcsak oszcillátorok rezgései alkalmasak, hanem olyanok is, amelyeknek alapja a hangrögzítés.

Ez a technológia már jóval a digitális szintetizátorok megjelenése előtt létezett, csak meglehetősen nehézkes volt. Sőt, a mai értelemben vett elektroausztikus zene megteremtője, Pierre Schaeffer már a 2. világháború előtt kitalálta, hogy a rögzített hang manipulálásával új, izgalmas hangzások hozhatók létre (lásd a sorozat 72. részét). De eszedbe juthat a Licht-Ton-Orgel (203. rész) vagy egészen közvetlen elődként a Chamberlin és a Mellotron (204-206.rész).

A hangdigitalizálás módját már nemcsak a szakemberek ismerik régóta, hanem te is, hiszen erről szólt részletesen a sorozat kezdetén a 22-27. rész. De ez már régen volt, ezért jöjjön egy rövid összefoglaló!

hmj02

A folyamatos, analóg jelet egy áramkör időnként megnézegeti, mintát vesz belőle. Ennek a mintavételnek a szaporaságát egy oszcillátor frekvenciája határozza meg, amit órajelnek hívunk. A minta alapú szintézisnél is van tehát oszcillátor, de nem ez állítja elő a digitális jelet, csak vezérli a folyamatot. Annak érdekében, hogy a mintavett jel ne tartalmazzon hamis mintákat, az órajel frekvenciájának, vagyis a mintavételi frekvenciának nagyobbnak kell lennie, mint amekkora legszaporább rögzíteni kívánt frekvencia duplája: fmintavevő > fmax. Azért, hogy a jel a maximális frekvenciájúnál szaporább frekvenciájú jelet ne tartalmazzon, az esetlegesen gyorsabb összetevőket még a mintavétel előtt aluláteresztő szűrővel eltávolítjuk. A mintavett jelet a további feldolgozásig megőrizzük, ez a minta tartása. A következő lépésben a mintát lépcsőkre, diszkrét értékekre osztjuk, amit kvantálásnak hívunk. Ahhoz, hogy a kvantált jeleket digitális rendszerekben fel tudjuk dolgozni, e jeleket kódoljuk. Legegyszerűbb esetben a kódolt jelben a 0 értékhez az egyik feszültség tartozik, az 1 értékhez a másik feszültség, és amíg nincs változás, ezen a feszültségen van a kimenet. Ezt hívjuk impulzuskód modulációnak, PCM-nek. Az analógból PCM-et gyártó áramkor az analóg-digitális, röviden AD átalakító.

Lejátszáskor a digitális-analóg visszacsináló, a DA átalakító a PCM jelet dekódolja, majd a kvantált jel lépcsőit szűrővel eltünteti, kivasalja. Ha a DA átalakító órajele ugyanakkora, mint az AD átalakítóé, akkor a visszajátszott hang frekvenciája ugyanakkora lesz, mint az eredeti hangé. Ha kisebb, akkor a lejátszott hang magasabb, ha nagyobb, akkor mélyebb lesz. Ez azért jó, mert nem kell annyi minta, ahány magasságú hangot akarunk, sokkal könnyebb a polifóniát megvalósítani.

A hangminta alapú szintézis legfőbb előnye az, hogy nem kell hozzá nagy számítástechnikai hókuszpókusz, hiszen a minta készen van, azt csak le kell játszani. A mélyebb hang azonban hosszabb ideig, a magasabb rövidebb ideig fog tartani. Az időtartamok kiegyenlítésére vagy éppen ellenkezőleg, szándékos nyújtására és rövidítésére különféle algoritmusokat találtak ki. Az algoritmusok ügyességétől is függ egy-egy szintetizátor minősége.

A korai szintetizátorok fejlesztőinek rengeteg egyszerűsítést kellett kitalálniuk ahhoz, hogy a hangminta alapú szintézis legalább valamilyen mértékben megvalósítható legyen. Gond volt a korabeli áramkörök kis sebessége, az áramköri integráció viszonylag alacsony foka (sok kis alkatrész kellett hozzá), az AD és a DA átalakítók számítási kapacitásának szűkössége, az AD és a DA-átalakítók kevés változatának ismerete és legfőképp a félvezető tárolók – ROM-ok – csekély kapacitása. Ezen okok miatt szó sem lehetett arról, hogy az akusztikus hangforrások digitalizációja kellően részletes, árnyalt legyen. A kvantálás kezdetben 8 bites volt, s csak lassacskán – persze, nem évszázadokat kell ezen érteni, csupán éveket – ment föl 10, 12, 14,16 bitre, hogy a 21. század első évtizedének végére elérje a 24 bitet is. A mintavételi frekvencia 22 kHz-cel kezdett, folytatódott a 44,1 KHz-cel és a 48 kHz-cel. Ma már a 96 kHz-es, a 192 kHz-es vagy akár a 394 kHz-es se ritka. A minimálisan szükséges mintavételi frekvenciának a többszörösével végzett mintavétel nemcsak azért előnyös, mert jóval több mintánk lesz, hanem főként azért, mert az átalakításhoz szükséges aluláteresztő szűrő meredeksége sokkal kisebb lehet, aminek a következményeként lényegesen csökkenhet a torzítás. Az eljárást túlmintavételezésnek (oversampling) hívják.

Kezdetben a hangszer hangját két részre osztották. Az egyik rész a megszólalási tranziens volt, tehát a felfutás. A másik rész az állandósult szakasz. Mivel ez kváziperiodikusnak tekinthető (nem szinusz, de ismétlődő), ezért ebből csak egy periódust rögzítettek, mint a hullámtáblás szintetizátorokban, és azt ismételgették. Ez utóbbi végtelenítést, hurkot hívják külföldiül loopnak. A „loopolás” azóta is használatos technológia az elektronikus zene világában. A modernebb szintetizátorokban persze sokkal hosszabbak a minták, s vannak hangszerek, amelyeknek a hangjában nincs olyan szakasz, amelyet hurkolni lehetne lényeges hangzásbeli romlás nélkül. Ilyen például a zongora, ezért van az, hogy egy-egy szintetizátor kiváló minőségét a zongora szintetizálásának demonstrálásával szokták bizonygatni a gyártók.

A jobb szintetizátorokban a hangszerhangok egyes sajátosságait nem vagy nem csupán időben, hanem rétegekre bontva választják szét. Például egy fuvola esetében külön-külön réteg a hangszer „hasznos” hangja és a megfújása miatt keletkező szélzaj. E rétegeket egyidejűleg és megfelelő arányban játssza le a szintetizátor egy-egy hang megszólaltatásakor.

Van még egy probléma, nevezetesen az, hogy ugyanaz a hangmagasságú hang másképp szól, ha pl. egy akusztikus zongorán éppen csak lenyomjuk a billentyűt, mint amikor erősen ráütünk. Egy hanghoz tehát több minta is tartozik, ha ezt a különbséget is szintetizálni akarjuk. Az eljárás neve többszörös mintavétel, angolul multisampling. A többszörös mintavétel arra is jó, hogy a legjobb mintát vagy a több mintából különböző szakaszokat választhassunk ki, a tökéletesebb szintetizálás céljából. A nagyobb káosz érdekében többszörös mintavételnek nevezik azt is, ha a modern szintetizátorokban nem minden hanghoz használják ugyanazt a mintát (csak más-más mintavételi frekvenciával lejátszva), hanem csupán 4-5 közeli hangmagasságú hanghoz, sőt, nem ritka, hogy minden hanghoz egyedi mintát, mintákat vesznek föl.

Mivel a hangminta alapú szintézis az egyik leggyakoribb szintézisfajta, számos cég még számosabb szintetizátorában használták és használják ma is. Sőt, nemcsak szintetizátorokban, hanem hangkártyákban is divatos volt az eljárás. Már most szólok, hogy a hangkártyák hangminta alapú szintézisét gyakran nevezik hullámtábla szintézisnek a szingapúri Creative Technology Limited cég ármánykodása miatt, amely vállalat a Sound Blaster néven ismert hangkártyáit hullámtábla szintézisű kártyákként reklámozta.

Ha már szóba került a Sound Blaster, érdemes elmerengni, hogy mit is tudott a legelső, 1989-ben megjelent SB kártya, 1.0 verziószámmal.

hmj03

A fenti fotón nem a szingapúri anyacég, hanem az USA-beli leány nevét látod a digitális hangprocesszoron. Valójában ez még nem DSP volt – nehogy tiszta legyen az ügy –, hanem egy egyszerű mikrovezérlő az Inteltől. A hangminta alapú szintézisen kívül szögmodulációs szintézist is tudott, a Yamahától vásárolt YM 3812 IC segítségével. A hangkártya csak 8 bites volt, a mintavételi frekvencia 22 kHz, tehát az átviteli sáv nem egészen 11 kHz-ig terjedt. Volt egy egyszerű midi illesztőegysége is. Minden kezdetlegessége ellenére alig egy év alatt ez lett a legnépszerűbb hangkártya, amihez hozzájárult, hogy a Microsoft a fejlesztőknek ezt a típust ajánlotta, ha azok olyan gépet akartak eszkábálni, ami megfelelt az MPC ajánlásoknak. Az MPC a néhai Szoftverkiadók Szövetségének (Microsoft, Creative Labs, Dell, Gateway, Fujitsu) ajánlásai voltak arra vonatkozóan, hogy mi tekinthető multimédiás számítógépnek. Amelyik gép megfelelt ezen ajánlásoknak (pl. legyen a gépben CD-meghajtó, specifikált hangkártya, stb.), arra rá lehetett nyalni a Multimedia PC matricát.

hmj04

Az MPC-nek több minőségi szintje volt – aztán érdeklődés hiányában megszűnt.

A hang műszaki paramétereit tekintve az SB 1.5 változat megegyezett az 1.0-val, de erről legalább van videó a YouTube-on. Azért azon elgondolkodik az ember, hogy amikor még nem ismerte föl a kártyát az operációs rendszer, mennyit kellett szarozni.

A hazánkban is legjobban elterjedt Creative kártya az SB 16 volt. Mint a típusjelölés is mutatja, ez a kártya már 16 bites felbontást tudott, a mintavételi frekvencia legfeljebb 44,1 kHz, mint a CD-é.

hmj05

A kártyában volt egy 2x700 mW kimenő teljesítményű füles erősítő is, és hogy mekkora buli volt ez a cucc, arra a legmeggyőzőbb adat, hogy a gyártó bevétele az SB 16 előtti évben 40 millió dollár volt, a piacra dobás évében (1992.) viszont már majdnem egymilliárd (!) dollárra nőtt, holott az SB 16 csak júniusban jelent meg.

A fenti videóban szereplő kompresszálás-dekompresszálás azt jelenti, hogy a kártyában a PCM hangmintákat veszteségmentesen tömörítették, hogy kevesebb memóriára legyen szükség. A Sound Blaster 16 piaci siker volt ugyan, ténylegesen azonban már akkor is csak egy kacat volt. Gyakran alapvető forrasztási hibákkal szerelték, az IC-ket se vizsgálták meg, mielőtt beépítették volna, sőt, az 1995-től gyártott változatokban a Yamaha IC-ket is felváltották egy olcsóbb, gyatrább hangú típussal. Ha netán napjainkban szeretnél egy SB 16 kártyát életre kelteni – feltéve, hogy van 16 bites operációs rendszerrel működő vasad –, előbb az összes kondenzátort ki kéne cserélned benne.

Egy nagy ugrással jutunk el a Sound Blaster Audigy 2-höz. Ez a 2002-ben bemutatott hangkártya már valódi 24 bites felbontású (az 1-es változat még vacakol), a mintavételi frekvencia sztereóban 192 kHz is lehet. Van benne Dolby Digital EX 7.1 csatornás dekódoló, és az első olyan SB kártya, ami viselheti a THX minősítő címkét. (Nyugi, erről még lesz szó.)

hmj06

Hozzá kell tennem, hogy azért ez sem stúdióminőségű hangkártya, ennél már akkortájt is voltak sokkal szebb hangúak. Ugyanis a nem profi hangkártyák frekvenciamenete nagyon szintfüggő, és az intermodulációs torzítás értékeik is nagyon gyatrák, a tranziens torzításokról nem is szólva (lásd a sorozat 64. részét). A profi hangkártyákat gondosan árnyékolják a zavarokkal szemben, és nem 3,5 mm-es aszimmetrikus, hanem 6,3 mm-es TRS csatlakozóik vannak, de még jobb esetben XLR-ek. Ezeket a kártyákat sokszor nem is szerelik be a számítógépekbe, hanem külön árnyékolt dobozban, hangmodul formában kaphatók.

A Creative az első Sound Blaster kártya 30 éves tiszteletére 2019. júliusában örvendeztette meg audiofil híveit az SB AE-9 típusjelű hangkártyával, amihez külső vezérlő is társul.

hmj07

Ez sem stúdióba való kütyü, mert pl. a mikrofon előerősítőjéről meglepően gyatra jel megy tovább az összes teszt szerint. Pedig még egy tápegység zajszűrőt (CleanLine) is beletuszkoltak a kártyába, aminek szimmetrikus, kombinált XLR/TRS bemenetére még fantom táplálású kondenzátor mikrofon (lásd a sorozat 113. részét) is dugható.

hmj09

A hasonló kategóriájú hangkártyák sajnos, szintén nem mikrofonos zenei felvételre készültek, a jó mikrofon előerősítők egyébként is ugyanolyan drágák, mint egy hangkártya – vagy még drágábbak. Viszont akkor meg az a kérdés, hogy minek a szimmetrikus mikrofon bemenet és a fantomtáp?

Az SB AE-9 lelke az „ESS ES9038pro Sabre” DA átalakító, amelynek mintavételi frekvenciája legfeljebb 384 kHz, a felbontás pedig 32 bit. Legalábbis elvileg, ugyanis a 32 bites tényleges felbontáshoz nagyon magas tápfeszültség kéne. Az ESS cég szerint a 32 bites felbontás a szabadalmaztatott Hyperstream architektúrának köszönhető. Ha azonban kicsit is behatolunk e technológia rejtelmeibe, rögtön kiderül a turpisság: a remek szabadalom csupán fölskálázza a 24 bites mintákat 32 bitesre a pontosabb belső feldolgozás érdekében, majd visszaalakítja legfeljebb 24 bitre. Az ESS honlapján sem található lényegében semmilyen érdemi műszaki adat (csak a THD+n és a jel-zaj viszony), de az kétségtelen, hogy nagyon sok, az SB AE-9-nél lényegesen drágább cuccokba is beépítik ezt az áramkört.

hmj08

A Dual Sound Core 3D is a csodatévő áramköri egységek közé tartozik. Egyebek mellett virtuális háromdimenziós hangzást varázsol. Sajnos, e varázslattól a csoda el szokott maradni. Ami viszont valóban jó: az SB AE-9 nemcsak PCM, hanem DSD64 kódolású jelet (lásd a sorozat 27. részét) is le tud játszani. Az már más kérdés, hogy honnan szerzel DSD filéket.

A hangkártya zabálhatnékja brutális, 75 watt. Ezért érdemes a számítógép tápegységének külön ágáról táplálni őt. A Creative egyébként azt ajánlja, hogy a gép tápegysége legalább 500 wattos legyen, legalább 80 Plus bronz tanúsítvánnyal. Ez azt jelenti, hogy a tápnak még kis terhelésen is legalább 82%-os hatásfokkal kell dolgoznia.

Az SB AE-9-hez igen sokoldalú szoftver is letölthető.

hmj10

Az SB AE-9 listaára 349 dollár volt 2019-ben, ezzel a kategória közepén helyezkedik el.