Cs. Kádár Péter - XXI. századi Diszkónika, 528. A fény hangja, a hang fénye – Ötödik sugár

A Digital Theater Systems (DTS) csakhamar beköszönt a saját megoldásaival.

A DTS vállalat alapítása Terry Beard hangmérnök nevéhez fűződik, aki elégedetlen volt a korszak analóg hangrendszereinek dinamikai korlátaival és frekvenciaátvitelével. Beard felismerte, hogy a 35 mm-es film fizikai jellemzői megnehezítették a nagy mennyiségű digitális adat tárolását közvetlenül a nyersanyagon, ezért a hangot leválasztotta a képről.

hfo02

A technológia áttörését Steven Spielberg támogatása hozta meg.

hfo03

Spielberg a Harmadik típusú találkozások DTS-alapú újrakeverésének meghallgatása után annyira elégedett volt az eredménnyel, hogy a Jurassic Park produkciójához ezt a formátumot választotta. A Universal Pictures és a Matsushita Electric befektetéseinek köszönhetően a rendszer gyorsan elterjedt, és az 1993. május 30-i bemutató idején már több mint 1 000 USA-beli mozit szereltek föl a szükséges hardverrel. A Jurassic Park sikere nemcsak a filmet, hanem a DTS formátumot is világszerte szabvánnyá tette, bebizonyítva, hogy a külső adathordozós megoldás megbízható és kiváló minőségű alternatívát nyújt.

hfo04

Ha valamiért kimaradt volna az életedből, az alábbi linkre kattintva nézheted meg a filmet magyar szinkronnal.

https://videa.hu/videok/film-animacio/jurassic-park-1-1993-hun-film-animacio-YrvteSBPEoUAO5RK

A hangosfilm történetében éppen a hang és a kép szétválasztása volt a korábbi módszer, de ez az analóg hang világában elég hamar megbukott. A DTS esetében éppen a szinkronizáció megoldása volt a trükk. Ennek lelke a 35 mm-es filmkópia képterülete és az analóg optikai Dolby Stereo hangsáv közé fényképezett, folytonos digitális időkód-sáv. Ez az időkód 24 bites, védett struktúrájú jel, amely tartalmazza a film egyedi azonosítóját, a tekercs számát és a képkocka pontos sorszámát.

hfo05

A szinkronizáció tehát nagyon pontos, legrosszabb esetben egyetlen képnyi eltérés lehetett, a hangadatok hordozója pedig speciális CD-ROM volt.

A vetítőgépre szerelt DTS olvasófej infravörös ledet és félvezetős fényérzékelőt használt az időkód beolvasására. Az olvasófej az adatokat egymás után, sorosan továbbította a DTS processzornak. A processzor az időkód alapján azonosította a filmmel, és összevette a behelyezett CD-ROM-on található azonosítóval. Ha az adatok egyeztek, elindult a lejátszás. Ha a mozigépész átugratott egy filmrészt, vagy a film elszakadt és vágni kellett, az időkód is ugrott, a DTS processzor pedig gyorsan a megfelelő pozícióba állította a CD-játszóban hangot.

A CD-ROM-ok használata lehetővé tette, hogy a DTS sokkal magasabb digitális adatsebességgel dolgozzon, mint a Dolby Digital, amelynek adatait a perforációk közé kellett "szuszakolni". A CD-k további előnye volt a tartósság: míg a filmkópia az ismételt vetítések során karcolódik és kopik, a digitális hangminőség a CD-ről lejátszva állandó maradt mindaddig, amíg az időkód olvasható volt. Ugyanakkor a rendszer némi szervezési és lebonyolítási nehézségekkel is járt. A CD-ket a filmkópiákkal együtt kellett szállítani, és fennállt a veszélye a lemezek elvesztésének vagy összekeverésének. Ennek kiküszöbölésére a DTS processzorok szigorú ellenőrző mechanizmust alkalmaztak, amely megakadályozta, hogy rossz lemez szólaljon meg a film vetítésekor.

A mozik DTS rendszereiben használt kódolási eljárás, az APT-X100 nevű algoritmus alapvetően különbözött a későbbi otthoni DTS változatoktól, amelyekről a DVD részletes bemutatásakor lesz szó. Az APT-X100 egy ADPCM alapú eljárás, amely nem a Dolby Digital pszichoakusztikus elfedési modelljét vagy ahhoz hasonlókat használ, hanem a jel spektrális redundanciáját és a prediktív kódolást aknázza ki. Az eljárást nem a DTS cég dolgozta ki, hanem az Audio Processing Technology Ltd. megbízásából a belfasti Queen’s egyetemen egy Stephen Smyth nevű pacák vezette társaság. Smyth később átment a DTS-hez, és a digitális hangprocesszorok (DSP-k) vezető fejlesztő mérnöke lett.


hfo06

Az APT-X100 nevű kódoló a bemeneti PCM jelet több lépésben dolgozza fel a tömörítés érdekében.

Az első lépés a hat (5.1) csatorna mindegyikében az alsávos kódolás. A PCM jelet kvadratúra tükörszűrők (Quadrature Mirror Filter, QMF) segítségével négy egyenlő szélességű frekvenciasávra bontják. A QMF-ek segítik a (majdnem) átlapolás nélküli rekonstrukciót, tehát azt, hogy az egyes sávok a lehető legkevésbé lógjanak egymásba. Minden digitális rendszer késleltet, a QFM lehetővé teszi, hogy (majdnem) ugyanakkora legyen a késleltetés a teljes frekvenciatartományban. A QFM viszonylag egyszerűen írható le felsőfokú matematikával, mutatom neked.

De még ennél is egyszerűbb, ha rajzolgatok, pontosabban, rajzolt a ChatGPT. Az első rajz a hagyományos sávokra bontást mutatja.

hfo07

Ha észrevetted, és biztosan észrevetted, van ám itt egy kis csalás. Ugyanis a négy sávra bontás egyetlen lépésben is elvégezhető volna, de itt mégis két szakaszban történik. Az elsőben két nagy sávra osztják a jelet, és aztán ezt a kettőt osztják tovább. Ez csak azért történt, hogy közelítsünk a QMF jellegzetességéhez. QMF-fel ugyanis egy tartományt mindig csak kétfelé lehet bontani.

Alapesetben tehát van egy tartomány, amit a sáv közepénél kétfelé bontunk, egy aluláteresztő és egy felüláteresztő szűrő segítségével. Ha a szűrők tökéletesek lennének, így:

hfo08

Módosítva a négy sávra bontó tömbvázlatot, azt a megoldást láthatod, amelyben QMF-ek vannak. A jelölések ne rettentsenek el, ezek a QMF matematikájából keveredtek ide. A tömbvázlat ebben a formában csak a folyamat menetét (topológiáját) mutatja, a szűrők tényleges jellemzőit az ún. szűrőkoefficiensek határozzák meg. Ezek a numerikus értékek határozzák meg a szűrő átviteli karakterisztikáját, vagyis azt, hogy mely frekvenciákat engedi át, és melyeket csillapítja, s hogy ezt hogyan teszi. A szűrőkoefficienseket imádják a digitális szűrőket tervezők, és ha netán ilyeneket akarnál tervezni, olvastam valahol egy nagyon lelkesítőt: „A szűrőtervezés lenyűgöző terület, amely a matematika precizitását ötvözi a mérnöki kreativitással.”

hfo09

A sávok felosztása lehetővé teszi, hogy az egyes frekvenciatartományokat különböző felbontással kódolják, igazodva az emberi hallás érzékenységéhez és a jel energiájához. Minden sávban a folyamatosan érkező jeleket kis, 4 ms-os időablakokban masszírozza a kódoló.

A következő lépés a lineáris predikció. E szép elnevezés azt jelenti, hogy az algoritmus a múltbeli minták alapján megjósolja a következő minta értékét. Csak a jóslat és a tényleges érték közötti különbséget (hibajelet, külföldiül reziduális jelet) kell kódolni, ami lényegesen kisebb felbontást igényel, mint a teljes jel. A lineáris predikció különösen hatékony a zenei és beszédjelek esetében, ahol a minták között erős korreláció áll fenn.

Aztán következik az adaptív kvantálás. Ez azt jelenti, hogy a lineáris predikció eredményéül kapott jelet kvantálja a kódoló, de úgy, hogy a felbontás mértéke, a kvantálási lépcső folyamatosan változik. A DTS cseles, mert abból indul ki, hogy a jel kicsit változik, és a kvantálási paraméterek kiszámolhatók a korábban kódolt jelekből. Ha időnként mégsem, hát úgy járt. Mivel a felbontás az energiatartalomtól függ, a nagyobb energiatartalmú összetevő felbontása nagyobb, mert így kisebb a kvantálási zaj (lásd a sorozat 26. részét). Ez a DTS „pszichoakusztikai modellje”, ami nem elfedéseken alapul, de nem is teljesen veszteségmentes. Végül a hibajavító kódok hozzáadása történik, és a teljes jelet fix hosszúságú keretbe teszik (framing). Az eredmény soros jelfolyam.

A DTS jellemzőit foglalja össze az alábbi táblázat:

hfo10

Az APT-X100 legnagyobb előnye a konkurens AC-3-mal szemben az alacsony számítási igény és a minimális kódolási késleltetés volt, ami kritikus szempont kép-hang szinkronizáció szempontjából a mozikban. Mivel nem használ bonyolult frekvencia-tartománybeli transzformációkat, mentes a jellegzetes pszichoakusztikus műtermékektől, bár magasabb lehet a zajszint a kódolt sávokban.

Következzék hát a dekódolás folyamata a mozikban! A dekódoló a filmen levő időkóddal vezérelt CD-ről beolvassa a bitfolyamot, igyekszik kijavítani a hibákat, értelmezi a kvantált jeleket, visszafejti a predikciót, rekonstruálja a négy alsávot, előállítja a kimenő digitális jelfolyamot.

hfo11

Aztán a DA-átalakítók megcsinálják az 5.1 csatornát. A DTS rendszer tervezésekor figyeltek a szinkron és a filmszakadás kérdésére is: a dekóderben levő tároló (puffer) viszonylag nagy mérete teszi lehetővé, hogy kihagyott vagy sérült filmkockák esetén se essen ki a hang – a tároló tartalma áthidalja a rövid idejű időkód-kimaradásokat, így a néző nem érzékel hangkimaradást kisebb sérüléseknél. Ez egyébként azt is jelenti, hogy a vezérlő kód előrébb van a filmen, mint az adott képkockához tartozó hang, tehát a CD-ROM-ról előbb olvassa be a tárolóba a képhez tartozó jelfolyamot a dekóder, mint mielőtt a hangnak meg kéne szólalnia. Ha hosszabb szakaszon hiányzik az időkód – például kópiacsere vagy nagyobb sérülés miatt –, a lejátszó automatikusan átvált az analóg optikai hangsávra, hogy ne maradjon csend a teremben.

hfo12

Sajnos, a ChatGPT még mindig nehezen boldogul a magyar ékezetes karakterekkel, de lusta voltam kijavítani.

hfo13

A legelső generációs hardver a DTS-6 volt, amely két CD-ROM meghajtót tartalmazott. Erre azért volt szükség, mert egy átlagos hosszúságú film hangsávja nem fért fel egyetlen 650 MB-os lemezre. A váltás a két lemez között észrevétlenül történt meg a lejátszás során.

hfo14

A későbbi, elterjedtebb modell a DTS-6D lett, amely már három meghajtót foglalt magában. A harmadik meghajtó lehetővé tette, hogy az előzetesek és reklámok hangsávjai egy külön lemezen legyenek, így nem kellett a főfilm lemezeit cserélgetni a vetítések között.

A processzorok belső felépítése egy ipari PC-re emlékeztetett, gyakran DOS operációs rendszert futtatva. Minden film CD-ROM-ja tartalmazott egy DTS.EXE nevű programot. Amikor a gépész behelyezte a lemezt, a processzor betöltötte ezt a szoftvert, amely tartalmazta az adott filmhez tartozó specifikus lejátszási algoritmusokat és esetleges hibajavításokat is. Ez a rugalmas szoftveres megoldás tette lehetővé, hogy a DTS folyamatosan fejlessze a kódolási technológiát anélkül, hogy a moziknak új hardvert kellene vásárolniuk.

A dekódolás során kritikus pont a mélynyomó csatorna erősítése. A mozis szabványok szerint a szubbasszus csatornának 10 dB-vel hangosabbnak kell lennie a fő csatornáknál a lejátszás során. A rajongói restaurációk és technikai elemzések rámutattak, hogy a korai DTS hangú kópiák esetében a szoftveres dekódoláskor akár 9 dB-s manuális emelésre is szükség lehet, hogy a hangzás megegyezzen az eredeti moziélménnyel, mivel a 16 bites tartományban való rögzítéskor a jelszintek eltérhettek a későbbi szabványoktól. Bár az APT-X100 bemenete 16 bites PCM, a prediktív algoritmus belső működése során elméletileg nagyobb dinamikatartományt is kezelhet. Vannak olyan elméletek, amelyek szerint a dekódoláskor érdemes 24 bites vagy 32 bites lebegőpontos pufferbe dolgozni, majd onnan visszakonvertálni a jelet, hogy elkerüljük azokat a vágási (clipping) műtermékeket, amelyek akkor keletkeznek, amikor a különböző frekvenciasávokból visszaállított jelet 16 bites fixpontos formátumba kényszerítjük. A DTS híres volt "agresszív" hangzásáról, amit gyakran a szándékosan hangosra kevert (néha a digitális maximumot érintő) kópiákkal értek el.

A DTS legnagyobb előnye a Dolby Digitallal szemben a jóval magasabb digitális adatsebesség volt volt. Míg a Dolby 320 kb/s-on osztozott az 5.1 csatornán, a DTS közel háromszor ennyi adatot engedett meg, ami tisztább magasakat és részletgazdagabb hangteret eredményezett.

2008-ban a DTS eladta moziüzemi üzletágát a Datasat Digital Entertainment-nek.

hfo15

A Datasat vitte tovább a technológiai örökséget, és fejlesztette ki a modern digitális processzorokat. Az AP25 egy 16 csatornás fenevad, amely nemcsak néhány DTS formátumot dekódol, hanem tartalmazza a Dirac Live nevű teremoptimalizáló algoritmust is.

hfo16

Ez a szoftver képes korrigálni a mozi akusztikai hibáit az impulzusválasz és a fázis precíz beállításával, így biztosítva, hogy a párbeszédek kristálytiszták, az effektek pedig hajszálpontosak legyenek.

Az elmúlt években ismét terjedni kezdett a poliészter alapú 70 mm-es film, a DTS erőre kapott, s a filmek szélén ismét ott lehet a vezérlő kód, akár IMAX, akár a hagyományos 70 mm-es filmről van szó.