Cs. Kádár Péter - XXI. századi diszkónika, 161. Ölelj át!

Az utóbbi évek nagy divatja az úgynevezett virtuális valóság – virtual reality, VR. Számunkra, akik térhatású hanggal foglalkozunk, egyáltalán nem akkora újdonság ez, hiszen a sztereó, kvadró, 5.1 és annál is nagyobb csatorna számú rendszerekben sokkal több a virtuális, vagyis a hallórendszerünk által összerakott hangforrás, mint a valódi. Sőt, tágabb értelemben minden rögzített vagy átvitt információ virtuális, hiszen egy festményen látható képi világ nem is ott van – a kiállító teremben vagy szobánk falán –, ahol gyönyörködünk benne.


oat02

A néző, a hallgató vagy a videojátékos bevonását immerziónak hívjuk külföldiül. A manapság leginkább elterjedt értelemben vett virtuális valóság immerzív. Ez azt jelenti, hogy az egyedi felhasználónak el kell tudnia „merülni” a virtuális világban, hogy azonosuljon vele. A VR használhatóságának egyik legfontosabb kritériuma, hogy a felhasználónak „hinnie” kell abban, hogy ő valóban létezik az adott virtuális világban. Ezt az érzést nagyban növeli az, ha az illető a saját nézőpontjából látja a virtuális kezét, testét, a virtuális világ tárgyai bármikor megfoghatók. A virtuális valóság tárgyainak, az egész környezetnek olyannak kell lennie, hogy a felhasználó természetes módon kerüljön velük kapcsolatba. Vagyis a virtuális világnak a saját törvényszerűségei határain belül ugyanúgy kell működnie, mint a valóságnak. Ideális esetben, megfelelő tapasztalás után ez a világ ugyanolyan megszokott lehet, mint a valóság. A hanggeneráló rendszerek készítik a virtuális tér hangjait, a hangvisszaadó rendszerek segítenek a felhasználónak a virtuális térben történő minél pontosabb helymeghatározásban. A képgeneráló rendszerek felelősek a vizuális jelenetek létrehozásáért, míg a képmegjelenítő rendszerek közé sorolhatók a vizuális megjelenítők és a virtuális sisakok. A VR valósághűségéhez tartoznak a mozgáskövető rendszerek is. Ezek első, nagy példányszámban megjelent változata a Wii és – a 2018-tól nem gyártott – Microsoft Kinect volt. Én a tekét csíptem nagyon.

Bennünket e sok követelmény közül a hangra vonatkozók érdekelnek. Az egyik ilyen követelmény, hogy a hang háromdimenziós legyen, amely lényegét tekintve fejhallgatós rendszer. A másik követelmény, hogy ha a fejünket mozgatjuk, netán a helyünket is, a mozgáskövető rendszer ennek megfelelően változtassa a hangképet. 

A második követelmény látszólag egyszerűen teljesíthető, hiszen az adott fejpozícióhoz tartozó HRTF függvények gyors átkapcsolásával a fejhez kötött változások átvihetők. Erre példa a Schoeps egyik programja, amelyet Android rendszerű mobiltelóra lehet ingyen letölteni, és amellyel az ORTF 3D mikrofonnyolcas segítségével készített eredeti vagy Dolby Atmos filéket lehet módosítani a szintén letölthető HRTF függvényekkel.

https://www.hauptmikrofon.de/de/3d/vrapp

oat03

Van azonban néhány probléma: Az egyik, hogy a „gyári” HRTF függvények egyenfüggvények, nem olyanok, mint annak a személyé, aki a VR sisakot viseli. Vagyis a leképzés pontatlan lesz. Az egyen-HRTF függvények sem térfolytonosak, hiszen akkor végtelen számúra volna szükség, de még nagyon sok véges számúnál is nehézséget okozna a gyors nyomkövetés. A harmadik, hogy a HRTF függvények a függőleges fejmozgatást és az oldalra biccentést általában nem veszik figyelembe, ehhez más nyomkövető eljárást kell(ene) alkalmazni.

A fejhallgatós hangvisszaadó rendszer ugyan lehetne többcsatornás, de ritkán az. A komolyabb szaksajtóban föl-fölvetik ezt a gondot, olykor meglehetősen dühösen is, ám a 3D hangzás ígéretével becsapott felhasználók ebből mit sem érzékelnek. Jellemző, hogy a virtuális sisakok, dobozok és egyebek tesztjeiben a hangról általában egy kukk sincs. 

A mikrofonozást illetően az utóbbi időben különösen divatossá vált az ezerszer elfelejtett ambiszon (ambisonics) rendszerek használata.

oat04

S itt megint vissza kell mennünk az időben, a kvadrofóniához. A kvadró rendszerek legalaposabb bírálata Michael Anthony Gerzon brit matematikustól és hangmérnöktől származik. Ez a rendkívül sok kísérletet és számítást végző zseni egyrészt azért bírálta a kvadrót, mert az emberi hallás számos pszichoakusztikai jellemzőjét nem veszi figyelembe, másrészt magassági információt nem szolgáltat. Gerzon különösen támadta a mátrix kvadrót, ezen belül az SQ-t – amiben egyébként teljes mértékben igaza volt.

oat05

Gerzon a társaival olyan mikrofon elrendezést ötlött ki, ami szerinte leképezi a teljes akusztikai környezetet, és e mikrofonok jeléből különböző eljárásokkal a 3D hangteret vissza is lehet adni. Az ambiszónia intellektuálisan nagyon izgalmas kaland. Előbb azonban emlékezzünk a lángészre! Vedd fül a fülesedet!

Az ambiszónia elméletének lényege, hogy ha a teret három dimenziósnak tételezzük föl, akkor három megfelelő eszközzel bizonyára visszaadható a tér minden jellemzője. Arról van szó, hogy ha egy gömbfelületen jól elhelyezett mikrofonokkal alakítjuk át a hangrezgéseket, akkor matematikai módszerekkel kiszámolhatjuk, melyek lennének a gömb belsejének közepében levő pont teljes térjellemzői, és e jellemzőket tudjuk felhasználni. A tényleges megvalósítást illetően négy mikrofont használnak. Az eredeti változatban az egyik gömb, a másik három mikrofon nyolcas karakterisztikájú. Ezt az elrendezést – ami a Blumlein mikrofonozás továbbfejlesztésének is tekinthető – hívják soundfield mikrofonnégyesnek.

oat06

A gömb karakterisztikájú W mikrofon szolgáltatja a jel amplitúdóját, az X nyolcasa az elöl-hátult, az Y-é a bal-jobbot, a Z a fent-lentet. Ezt nevezik az ambiszónia „B” formátumának. Van egy másik formátum is, amikor – technikai okok miatt – négy vese karakterisztikájú mikrofont szerelnek egy mikrofonházba, egy tetraéder csúcsait alkotva. Ez a formátum az ambiszónia „A” változata.

oat07

Matematikailag bizonyítható, hogy az „A” formátum átalakítható „B”-be, ha amplitúdó korrekciót és késleltetést is alkalmazunk. Most nem fogom bizonyítani, okés? A „B” formátumú jeleket lehet úgy korrigálni, hogy a végeredmény iránykarakterisztikája független legyen a frekvenciától. Ez más mikrofon elrendezésekkel lehetetlen. 

A W, X, Y és Z jelek kombinálásával bármilyen hagyományos iránykarakterisztika létrehozható.

oat08a

De nemcsak egy mikrofoné, hanem mikrofonozási megoldásoké, tehát pl. ORTF, dupla ORTF, MS, dupla MS, stb. Szoftveresen pedig bármilyen elrendezést meg tudunk valósítani, a monótól akár a 22.2-ig és még tovább. S ugyancsak szoftverek segítségével, a pszichoakusztikai jellemzőket is figyelembe véve, a sztereó fejhallgatóban 360⁰-os, 3D-s teret fogunk hallani. Ezt állítják a cégek.

Rossz hírem van. Ugyanis a fejhallgatós hallgatás érdekében olyan szoftverrel játszhatsz, amilyennel csak akarsz, a teljes hangtérből csupán a füledtől balra-jobbra, hátul, a fejed tetején és a fejedben fognak szólni a hangok. Ne csapd be magad a VR-szemüvegekben megjelenő látvánnyal! Jelenleg nem ismerünk olyan eljárást, ami előre rakná a hangforrásokat. Ettől még az ambiszon felvételek szólhatnak szépen, csak nem kéne hazudni. 

Az ambiszon rendszerek talán legnagyobb előnye, hogy szoftveresen lehet a teret tágítani, forgatni, egyes részeit közelebb vagy távolabb hozni, mintha a kamerával zoomolnánk. Ebben az értelemben valóban segítheti virtuális valóságot.

A következő három videón helyezd az egérmutatót a képre, és húzogassad balra, jobb, le és föl!

Ez meg egy kis tervezési magyarázat:

Az ambiszónia divatja több mikrofongyártó céget hozott lázba. A mikrofonjaikhoz ingyen csodabővítményt és esetenként fej- vagy fülhallgatót is kínálnak. Az egyik ilyen gyártó a Rhode. Az NT SF1 négy vese mikrofont tartalmaz, „A” formátumban.

oat09

Műszaki paraméterei nagyon kellemesek.

oat10

A listaára 1 000 dollár körül van. Természetesen szoftver is van hozzá.

Lehet persze 32 kapszulával is gyártani ambiszon mikrofont.

oat11

De van, aki beéri 8-cal. 2 000 dollárért bármit.

oat12

Az egyik legígéretesebb mikrofonnak a Sennheiser AMBEO® VR Mic típusa látszik.

oat13

Az „A” formátumban elrendezett négy elektret vese kapszula műszaki adatai ugyan nem kiemelkedőek, viszont nagyon sok tartozék jár a mikrofonhoz, vagy vásárolható meg. A mikrofon listaára 1 650 dollár.

oat14

Ha netán hozzájutsz egy ambiszon mikrofonhoz vagy fájlokhoz, és játszani akarsz ingyen ambiszon szoftverrel, az AmbiX v0.2.7 vagy v02.8 bővítményt ajánlom. Ez egy plugin csomag, amelyet letöltés és futtatás után a munkaállomás, pl. a Reaper bővítmények mappájába kell másolni. Innen tölthető le:

http://www.matthiaskronlachner.com/?p=2015

oat15

Nagyon érdekes hatásokat lehet elérni vele. Én a hangforrások helyzetét szeretem tologatni. Hangsúlyozom, nem lesz 3D!

oat16

Ez az összeállítás is ezzel a szoftverrel készült: