Cs. Kádár Péter - XXI. századi Diszkónika, 472. A CD nagycsalád – CD interactive harmadszor

A CD-i fejlesztői a mozgóképek megjelenítésének módjával szenvedtek a legtöbbet. A CD korlátai és a korabeli fogyasztói számítástechnika színvonala alaposan behatárolta a lehetőségeket.

A cél az analóg VHS minőségének megközelítése volt. A 21. században ez nem tűnik egetverő feladatnak, de ha arra gondolsz, hogy egy okosteló kijelzőjén megjelenő képen is milyen sokan vagyunk képesek órákig élvezkedni, akkor nem lehet eléggé lebecsülni a fogyasztói igényeket.

A CD-i videoképe négy, egymás fölötti rétegből áll. Az első réteget a kurzor, vagyis a mutató (pl. nyíl) használta, méretét 16*16 pixelre korlátozták, s egy kurzornak csak egyetlen színe lehetett. A második és harmadik réteg a kurzor alatt volt látható, és teljes képernyős képekhez voltak használhatók. A negyedik réteg az egyszínű hátteré volt, vagy MPEG Full-motion video-hoz (FMV) használták, esetleg külső forrásból származó videó megjelenítésére, ha a CD-i játszó támogatta azt. Az FMV-t sem fogod megúszni, várj a sorodra! Mindkét középső réteg képe egy-egy memóriába került. A középső két réteg valamelyikén lévő kép részei átlátszóak lehettek, így az alatta lévő réteg láthatóvá vált. Ezt használhatták például feliratok vagy menüsorok megjelenítésére egy képen. Mindkét réteg használható volt az egyik képről a másikra való áttérésre, akár úgy, hogy váltják egymást, akár úgy, hogy keresztkeveréssel az egyik eltűnik, miközben a másik előjön.

A CD-i ben többféle kódolást használtak a képekhez és a videóhoz. Ezek a kódolási módok módosított változatai napjainkban is léteznek. A CD-i alapvető kódolási módja a Delta-YUV nevű volt.

Akkor most jött el az a pillanat, hogy bevalljam, miszerint az emberi látás sajátosságai és az erre hajazó műszaki megoldások részletezése a sorozat középtávú terveiben szerepel, ezért most csak néhány alapvető tényt rebegek el.

A szem átlátszó belső folyadékainak köszönhetően alakul ki a tárgyak képe a retinán. A retina a szemgolyó legbelső része, ahova annak képe vetül, amit éppen látunk. A retina, más néven a szemideghártya sejtjei átalakítják a képet idegi jelekké. Ha a fényérzékeny sejtek meghatározott fényingert kapnak, idegimpulzusok indulnak a nagyagy nyakszirti részéig, s ott kialakul a látás élménye. Az idegimpulzusokat tehát a retina sejtjeinek a tevékenysége hozza létre. Az agysejtek végződései meghatározó szerepet játszanak. Elsősorban a csapok és pálcikák, amelyek az alakjukról kapták a nevüket. Az előbbiek a színek megkülönböztetésére szolgálnak, az utóbbiak az árnyékokat, a fényeket és a kettő közötti átmenetet ismertetik fel. Ám ahhoz, hogy a csapok el tudják végezni a dolgukat, elég erős fényre van szükség, ezért van az, hogy éjjel minden szürkének látszik. A pálcikák ezzel szemben a félhomályban is meg tudják különböztettetni a formákat, és ilyenkor kicsit hozzájárulnak a színek érzékeléséhez is. Csapokból háromféle van: az L-csapok maximális érzékenysége: 560 nm (sárga), az M-csapok maximális érzékenysége: 530 nm (zöld), az S-csapok maximális érzékenysége 430 nm (kék) hullámhosszon van. A csapok válaszainak gyakorisága nemcsak a színtől, hanem annak intenzitásától is függ. Ezért az idegrendszernek a színérzet előállításához legalább két csaptípusra van szüksége, hogy összehasonlíthassa a jeleiket. A színlátás a csapok válaszainak kombinációit használja fel a színek előállításához. Becslések szerint az ember akár hétmillió színt és színárnyalatot is megkülönböztethet.

cih02

A színterek a színek ábrázolására használható virtuális térbeli koordináta-rendszerek, amelyekben az egyes színek tulajdonságait azok koordinátái fejezik ki. Az egyik alapvető színtér az RGB. Az RGB színtér olyan additív, összegző színmodell, ami a vörös, zöld és kék fény különböző mértékű keverésével határozza meg a különböző színeket. Az elnevezése ezen három alapszín angol megfelelőinek első betűiből ered: Red (piros), Green (zöld), Blue (kék). Elsődlegesen elektronikai eszközök és a számítástechnika terén alkalmazzák, pl. képernyők, kijelzők, érzékelők esetén.

Az RGB skálán egy színt az határoz meg, hogy milyen intenzitású a három komponense. Az RGB kockában a tengelyek a három alapszínt adják meg, 0 és valamilyen maximális érték között.

cih03

Legyen a maximális érték 1! A 0 és az 1 határokon belül értelmezhető a színtér összes eleme. Ha mindhárom 0, akkor az eredő szín fekete lesz, ha mindhárom 1, akkor fehér, s az összes köztes érték eredményezi a különböző árnyalatokat. Pl. ha a piros is 1 és zöld is 1, viszont a kék 0, akkor sárga; ha a kék is 1 és zöld is 1, ám a piros 0, akkor türkiz; ha a piros 0,5, a kék 1, de a zöld 0, akkor pedig lila az eredő szín. A fenti ábrákon gyakorlati okok miatt 255 a maximális érték, de ez ne zavarjon nagyon, könnyebb így számolni, például a digitális színpalettákon ennek megfelelően adják meg egy szín paramétereit, hogy ne kelljen törtekkel bajlódni. Az RGB színtérben nagyon sok, az emberi szemmel látható szín keverhető ki, de nem az összes. Ám nem emiatt használnak más színtereket is.

Amikor hajdanán, a 2. világháború után komolyabban kezdtek foglalkozni a színes televíziózással főként az USA-ban, a szabványosításért felelős szervezet kikötése az volt, hogy a színes adást fekete-fehér készülékkel is lehessen nézni fekete-fehérben, a színes tv-készülékeken pedig a fekete-fehér adást is nézni lehessen, természetesen fekete-fehérben. Ezt színes/fekete-fehér kompatibilitásnak hívják. Nem kevés csatározást követően 1953. decemberében hagyták jóvá az NTSC-nek nevezett eljárást. Ebben a rendszerben az Y-nal jelölt jel a pillanatnyi fénysűrűségnek megfelelő jel, amit nem túl pontosan világosságjelnek is hívnak. Ebből állítja elő a tv-készülék a fekete-fehér, színek nélküli képet. A fekete-fehér tv-készülékek más képtartalom jelet nem tudnak feldolgozni, ezzel szemben a színesek további két színkülönbségi jelet is. Az egyik ilyen jelnek U a neve; ezt úgy állítják elő, hogy a kék jelből kivonják a fénysűrűség jelet (B-Y). A másik a V, ez pedig a vörös és a fénysűrűség jel különbsége (R-Y). Az U és V jelek arra utasítják a televíziót, hogy változtassa meg egy adott képpont színét anélkül, hogy megváltoztatná a fényerejét. Másképpen, az U és V jelek azt mondják a monitornak, képernyőnek, hogy az egyik színt világosabbá tegye a másik árán, s ehhez mennyivel kell eltolnia az adott képpont színét a szürkéhez képest. Minél nagyobbak az U és a V értékek, annál telítettebb (színesebb) lesz a képpont. Minél közelebb kerülnek az U és V értékek a nullához, annál kevésbé tolódik el a szín, ami azt jelenti, hogy a vörös, zöld és kék fények egyformán világítanak, és szürkébb képpontot eredményeznek. Ez viszont azt is jelenti, hogy ha az U és V jelek nullák vagy hiányoznak, akkor csak szürkeárnyalatos kép jelenik meg a színes tv-készülék képernyőjén. A színkülönbség-jelek használatának tehát az az előnye, hogy ahelyett, hogy pl. megmondaná, mennyi vörös van egy színben, azt mondja meg, hogy mennyivel több vörös, mint zöld vagy kék.

cih04

Az YUV-ből elvileg tökéletesen előállítható az RGB, ami a gyakorlatban sok tényező miatt nem igaz, de ez nem annyira zavaró, mert a színek korrigálására sokféle módszer létezik. Van viszont még egy, egyáltalán nem lényegtelen előnye az YUV jelrögzítésnek és -átvitelnek, mégpedig az, hogy mivel az U és a V jel különbségi jel, az átviteléhez és a rögzítéséhez sokkal kisebb sávszélesség kell, vagyis az YUV jelek némi (?) megalkuvással ugyanolyan széles csatornában elfértek, mint a szimplán csak fekete-fehérek. Az NTSC rendszert Európában nem használták, de a PAL és a SECAM nevű rendszerek ugyancsak a YUV szintérre épültek, viszont a színkülönbségi jelek átvitele, rögzítése más és más volt, nehogy esetleg valami véletlenül egységes legyen.

A CD-i-ben használt delta-YUV trükkje arra épül, hogy a képérzékelésünk a fénysűrűség változásait pontosabban, gyorsabban és könnyebben követi, mint a színek változását. A delta-YUV 8 biten tárolja egy-egy képpont adatait úgy, hogy 4-4 biten csak az előző képtől való eltérést rögzíti, de az U és V értékekből csak minden másodikat. A delta YUV eredményezte a CD-i legjobb képminőséget bővítő kártya nélkül, de a nagyobb kontraszttal nem tudott megbirkózni. Egy-egy kép terjedelme 100 kB volt.

A CD-i másik képtárolási módszere az RGB 555 volt. Mint az elnevezése is mutatja, mindhárom színösszetevőt 5-5 biten tárolta, így legfeljebb 32 ezer színt tudott megjeleníteni. Ráadásul egy-egy kép két réteget is elfoglalt, a terjedelme 200 kB volt.

A CLUT (Color Look-Up Table) az egyszerű grafikák kódolásának egyik módja. Az adott képen használandó színeket színtáblázat tárolja, ami drámaian csökkenti a kép terjedelmét, mivel a színértékek a megfelelő CLUT-bejegyzésre vonatkoznak. A CD-i-ben egy CLUT képnek lehetett 8 bites (256 szín), 7 bites (128 szín), 4 bites (16 szín) vagy 3 bites (8 szín) színtáblázata. A CLUT kicsit hasonló ahhoz, mint a sorozat 288. részében ismertetett hullámtábla szintézis a hangszer-szintetizátorok esetén. Noha nem így nevezik, valójában CLUT-szerű táblát használsz akkor is, amikor pl. a szövegszerkesztőben betűszint választasz, csak ott már átkonvertálták a színtáblázat értékeit RGB-re.

cih05

A futamhossz kódolás (Run Length Encoding, RLE) az egyik legegyszerűbb, legrégibb veszteségmentes tömörítés, már a sorozat 96. részében volt szó róla, csupán a neve nem szerepelt. A lényege, hogy ha egymás után több, azonos színű képpont van, akkor nem képpontonkénti a kódolás, hanem csak egyszer szerepel a szín neve, utána pedig az, hogy hány képponton keresztül ugyanaz a szín. Legyen például egymás után öt narancs színű képpont, aztán négy lila, két hupikék, három bugyirózsaszín, két lila, négy narancs, két lila, hat bugyirózsaszín, három lila! A narancs jele n, a liláé l, a hupikéké h, a bugyirózsaszíné b. A kód n5l4h2b3l2n4b6l3. Az egyes színeket pl. az RGB értékük jellemezheti, de cselesebb, ha CLUT színtáblából nyerik. Így egészen kis terjedelmű, 10-30 kB-os képeket kapunk. Ezért szeretik a futamhossz kódolást különösen animációk készítéséhez. A Base Case (lásd a sorozat 470. részét) CD-i-k legtöbb animációja futamhossz kódolású. Hozzáteszem, hogy a futamhossz kódolás sok, fejlettebb grafikai eljárás része, pl. a .gif kiterjesztésű animációk alapja a futamhossz kódolás.

De miért használtak a CD-i-ben ennyiféle kép- és videó fajtát? Azért, mert a kompakt lemez kapacitása kicsi volt, a gépek sebessége úgyszintén, s ez még az a korszak volt, amikor minden bitnyi megtakarítás győzelemmel ért föl.

S hogy még eggyel több legyen, a QHY (Quantized High Y) olyan kódolási technika, amely kezdetben nem volt része a CD-i eljárásnak, de a Zöld Könyv tartalmazza, és minden CD-i játszó támogatta. A QHY a DYUV és a futamhossz kódolás kombinációja, ami nagyon éles, kiváló minőségű, természetes képet eredményez. A képek terjedelme mintegy 130 kB.

S akkor most következik a Full-motion video, rövidítve FMV, amit magyarra szó szerint teljes mozgású videónak lehetne fordítani, csak ennek nincs túl sok értelme. Az FMV nem kódolási mód, hanem a számítógépes játékok menetének interaktív befolyásolása előre rögzített videofilék segítségével. Az elsősorban FMV-n keresztül bemutatott, irányítható játékokat interaktív filmeknek vagy filmjátékoknak is nevezik. Olyan játékok tehát, amely moziszerű forgatókönyv szerint mutatják be a játék menetét, gyakran animált vagy élőszereplős felvételek jó minőségű videóján keresztül.

Az interaktív mozi korai példája volt az 1967-ben bemutatott Kinoautomat című film, amelyet Radúz Činčera írt és rendezett. Ezt a filmet először a montreali Expo '67 -en mutatták be. Ez a film a lézerlemez vagy hasonló technológia feltalálása előtt készült, így bizonyos pontokon élő moderátor jelent meg a színpadon, és felszólította a közönséget, hogy két jelenet közül válasszon. A kiválasztott jelenetet a közönségszavazást követően vetítették le. A film nyitó jelenetében a főhős lakása lángokban áll.

Az FMV-n alapuló videojáték népszerű példája az 1983-as Dragon's Lair (A sárkány barlangja) volt, amely Don Bluth, a Disney munkatársának animált FMV-jét tartalmazta.

cih06

A játékos irányította a főszereplő egyes mozdulatait. Veszélyben a játékosnak kellett eldöntenie, melyik lépést, akciót vagy kombinációt választja.

cih07

Ha rossz lépést választott, akkor az „Elveszítettél egy életet” jelenet volt látható, amíg a játékos meg nem találta a megfelelőt, amely elérhetővé tette számára a történet többi részét. A Dragon's Lair-ben csupán egyetlen lehetséges sikeres történet volt; a felhasználó egyetlen tevékenysége az volt, hogy kiválassza vagy kitalálja a programozók által tervezett lépést. Ennek ellenére a Dragon's Lair-t sokan szerették.

Az első olyan játék CD-i-n, amely FMV-n alapult, Menekülés CyberCityből címmel jelent meg. A Fathom Pictures nevű cég készítette 1992-ben, és az AIM terjesztette az USA-ban.

Szintén 1992-ben jelent meg a Lányklub, a Philips Interactive Media terméke, s amelyben a lányok szimulált randira indulhatnak az univerzum harminc legmenőbb pasijával.

Az 1993-ban piacra dobott Strip Poker Live szereplői csak arra vártak, hogy levetkőztesd őket. Választhattál a szőke, svéd Juliette, a barna, mediterrán Ombretta, a Mauiból most érkezett Aysha, a párizsi kifinomult Christine és a sportos Roby között.

cih08

Lényegesen szebb és fejlettebb volt a Cludeo, amit legfeljebb hatan játszhattak, s egy társasjáték elektronikus változata volt. 1994-ben készítette a 3T Productions nevű cég.

Még rengeteg FMV-n alapuló CD-i kiadványt föl lehetne sorolni, ám ezek többsége más platformokon megjelent programok átdolgozásai. Nemcsak játékok jelentek meg FMV-vel, hanem olyan ismeretterjesztő CD-i kiadványok is, mint pl. a Titanicról szóló.

A Philips azzal is próbálkozott 1993-ban, hogy kb. 20 játékfilmet CD-i-n jelentetett meg, ez volt a CD-i Digital Video, de erről a marhaságról elég hamar, már 1994-ben leszokott.

cih09

A CD-i az FMV filéket a negyedik képrétegen, MPEG-1 kódolással tárolja. Az MPEG-1 jórészt a Philips találmánya. A filék megjelenítéséhez feltétlenül szükséges bővítmény a digitális videó kazetta (lásd a sorozat 470. részét). Az MPEG-1 lehetővé tette a CD-i számára, hogy a mozgóképeket másodpercenként 24, 25 vagy 30 képkocka sebességgel játssza le. Az MPEG-1 videó a diszkrét koszinusz transzformáción (lásd a sorozat 96. részét) alapul. Ennek a kódolásnak is az a kiinduló pontja, hogy egy videóban az egymást követő képek általában nem nagyon különböznek egymástól. Az egyes képek teljes kódolása és tárolása helyett az MPEG-1 jórészt csak a képek közötti különbségeket rögzíti. Három különböző típusú MPEG-képkocka létezik. Az I vagy Intra képkocka teljes képből áll, amely önállóan, más képek információi nélkül jeleníthető meg. Intra képkockát mutat a képernyő gyors előre- vagy hátrafelé kereséskor. A P vagy progresszív képkockának információra van szüksége a korábbi képekből. A B vagy Bi-directional képkocka információt lop a korábbi és a jövőbeli képből is a kép elkészítéséhez. A videót alkotó képeket nem időrendi sorrendben tárolja a lemez, hanem szétszórva. Lejátszáskor az MPEG dekóder gondoskodik az információk dekódolásáról és az összes kép megfelelő sorrendbe állításáról.

Az összes réteg tartalma egyszerre is megjelenhetett még akkor is, ha eltérő felbontásúak voltak.

A CD-i játszók mindkét fő réteg (a második és a harmadik) tartalmát normál (384*280 képpont), dupla (768*280 képpont) vagy nagy (768*560 képpont) felbontásban képesek megjeleníteni. A CD-i legnagyobb felbontását QHY-képekhez és MPEG állóképekhez használták, ez egyben az a legnagyobb felbontás, amely hagyományos, 4:3 képarányú tévén láthatóvá tehető. A CD-i fénykorában tehát nem volt szükség jobb képminőségre, hiszen a tévék sem tudtak többet. Sőt, az NTSC képernyő általában valamivel kevesebb sort jelenített meg, minden sorban valamivel kevesebb képponttal. Az NTSC felbontás legfeljebb 720*480 képpont, szemben a PAL és a SECAM 768*576 képpontos felbontásával. Ha a legnagyobb felbontású kép jelent meg egy NTSC képernyőn, e kép egyes képpontjai kipottyantak. Ha NTSC kép jelent meg PAL képernyőn, nagyon kicsi fekete sávok keletkeztek a képernyő alján és tetején. (Nagyon keskenyek, nem olyan brutálisak, mint szélesvásznú filmek esetén.) Ezért meg kellett határozni a „biztonsági területet”, vagyis a kép méretének akkora részét, amely várhatóan az összes tévé-készüléken megfelelően jelenik meg. Ez a biztonsági terület 640*420 képpont; ezen a területen kívül semmilyen „kritikus” információ, például menügombok nem lehetnek. A biztonsági terület korlátai ma is érvényesek a DVD-kre vonatkozóan, hiszen a DVD sem HD vagy UHD formátumú.

A CD-i formátum nagy hátránya, hogy csak CD-i játszókon játszhatók le a CD-i lemezek. A CD-i Ready speciális CD-i lemez.

cih10

 

A Zöld Könyv szabályait követve a CD-i lemez tartalmazhat hangi tartalmakat. Ezeket a CD-i sáv után kell elhelyezni, amely mindig az 1. sáv. Már volt szó arról, hogy a korai CD-DA játszók ezt a CD-i sávot hangként játsszák le, ami a berendezés, különösen a hangsugárzók károsodását okozhatja. Ennek megakadályozására találták ki a CD-i Ready formátumot. A CD-i Ready lemezen a CD-i programadatok, beleértve az összes hang- és videó információt, az 1. sávot megelőző „néma” szektorokban tárolódnak. Ezeket a szektorokat a legtöbb CD-DA játszó kihagyja, de CD-i játszón olvashatók. Ez lehetővé tette olyan CD-audió lemezek létrehozását, amelyek CD-i játszón lejátszva extra információkat tartalmaztak, viszont nem okoztak gondot, ha a lemezt normál CD-DA játszóban játszották le. A CD-i Ready lemez nem igazi CD-i lemez, mivel nem követi a Zöld Könyvnek a hangi adatok elhelyezésére vonatkozó szabályait, de minden valaha gyártott CD-i játszó lejátszotta őket. A CD-i Ready lemezek általában zenei CD-k. Ezek a CD-k a CD-i Ready vagy CD-i Music jelzésről ismerhetők föl a lemez csomagolásának bal felső sarkában. Vagy nem.

cih11

A Philips egy idő után tisztában volt azzal, hogy ha a CD-i nem játszható le CD-ROM meghajtóval, akkor biztosan el fog bukni. Kínjában kitalálta hát a CD-i Bridge-t, amivel megoldotta ezt a problémát. Ezért Bridge, vagyis híd a neve. A Fehér Könyv tartalmazza a kötelező paramétereit. A CD-i Bridge a CD-ROM XA (lásd a sorozat 469. részét) egyik változata, amely a Zöld Könyv előírásainak is megfelel egy CD-i alkalmazás segítségével. A CD-i Bridge a CD-ROM ISO-9660 fájlrendszerén alapul, amelyet a legtöbb számítógép támogat. A hangot és a videót általában CD-i kódolási technikákkal rögzítették: a CD-i 2. mód 2. Form szerint ADPCM-mel a hangot és MPEG-1-gyel a videót, míg az adatokat a 2. mód 1. Form szerint tárolták.

 cih12