BonFire blogja

Minden, mi kreatív…

Karaoke és acapella készítése zenéből

2010. szeptember 19. 00:01 - BonFire

Nem kell félni, nyájas olvasóim. Nem bolondultam meg, hogy ilyen cikk írására adom a fejem, hanem nyomós okok késztetnek rá. Igazság szerint oly sokan kérdezik, hogy hogyan kell ezt csinálni, és én már annyiszor elmagyaráztam különböző fórumokon a műveletet, hogy nincs kedvem újra és újra 101-edjére is leírni, csak azért, mert valaki lusta keresni, vagy nem tud keresni, vagy fárasztó neki végigolvasni huszon-egynéhány topikot. Ezért úgy döntöttem, írok egy blogposztot a témáról, hogy legyen honnan belinkelni az általam és mások által milliószor leírt technikákat. Akit tehát nem érdekel behatóbban a zene, a hanghullám-elmélet és a fizika, az bátran koncentráljon a Photoshopos bejegyzéseimre, ezzel hadd tágítsam egy kissé a rászorulók buráját.

Most gonosz leszek, és a kíváncsi emberkéknek egy rögtönzött kis fizikaórát fogok tartani, akár akarják, akár nem. Bizonyos ismeretek nélkül nem fogja ugyanis megérteni, hogy amit kér, az miért lehetetlen! (Remélem, ez már eleve sok reménykedő kedvét szegte. Amennyiben így van, ne fárasszák tovább magukat a cikk olvasásával.)

Dúl a Mega- Giga- és egyéb sztárcsináló műsor. Sokan szívesen próbálnák ki magukat, és énekelgetnének a kedvenc dalukra, ha az a fránya énekes/énekesnő már eleve rá nem énekelt volna, ezzel tönkretéve a műélvezetet. Felmerül egyre többször a kérdés: hogy lehet az éneksávot kiirtani a zenéből, hogy jó kis karaoke-alapot kapjunk? Kezdjük mindennek az elején, egy kis elmélettel.

A hang hullám. Hang akkor keletkezik, ha egy rugalmas anyag rezeg, ezáltal megrezegteti a közeget, amiben van, esetünkben ez a közeg a levegő, ezek a rezgések hullámokat keltenek, amelyek megrezegtetik a dobhártyánkat, és ilyenkor meghalljuk a hangot. A hanghullámok általában igen bonyolult formájúak és felépítésűek, mivel ritkán szólalnak meg önmagukban. A harmonikus rezgőmozgást végző hangképző dolgok egy tiszta szinuszjelet adnak. Ez a természetben igen ritkán előforduló hang. Leginkább az emberi füttyszó felel meg neki, ha leszámítjuk a fúvás zaját. A legtöbb hangszer azonban nem csak a zenei alaphangot szólaltatja meg, hanem annak egész számú többszöröseit, az úgynevezett felharmonikusokat, és ezek hozzákeveredve az alaphanghoz adják a hangszer jellegzetes és felismerhető hangját. Ha nem lennének felharmonikusok, nem tudnánk egymástól a hegedű és a trombita hangját megkülönböztetni.

A hanghullámokban általában szabályos ismétlődések fedezhetők fel. Viszont hang is többféle van. Vannak zajkeltő hangszerek, amelyek nem zenei hangot, hanem zajt, zörejt és dörejt adnak ki magukból. A legtöbb ütőhangszer ilyen. De nem kell megijedni, a személtetés kedvéért a legegyszerűbb hangnál, a szinusznál maradunk.

Aki járt általános iskolába, és nem aludta végig az összes matemetika órát, az valószínűleg találkozott már a függvényekkel, és a parabolákkal is. A tiszta szinuszjel ilyen parabolákból áll. Amikor a hang megszólal, a rezgés elindul a nullpontról az egyik irányba, fokozatosan lassul, majd elérve a csúcspontot elindul a másikba, ott is eléri a csúcspontot, és végül visszaér a nullpontra, ahonnét kiindult. Ez egy darab hullám. Nullponttól nullpontig tart, és ennek a hossza a hullámhossz, ami fordítottan arányos a frekvenciájával. Egy hanghullámot általában két adattal írnak le: a frekvenciájával és az amplitúdójával. A frekvencia, a másodpercenkénti rezgésszám: minél nagyobb ez a szám, annál magasabb a hang. Az amplitúdó a kilengés mértéke: minél nagyobb az érték, annál hangosabb az adott hang. Van egy harmadik fogalom is, amit meg kell jegyeznünk, ez pedig a hanghullám fázisa. A fázis a hanghullámnak azon szakasza, amely a nullponttól a következő nullpontig tart, tehát az egész hullám fele. Ez nagyon fontos lesz a későbbiekben. A másik irányba induló rezgés már egy másik fázis.

A gyakorlati hangfelvételek közül (és most tekintsünk el az egyszerűség kedvéért a sokcsatornás Dolby Surroundtól) kétfajtát különböztetünk meg. Az egy csatornás felvételt (monó), illetve a kétcsatornás felvételt (sztereó). Léteznek azonban úgynevezett álsztereó hangok is. Ebben nincs más, csak két csatornában jelenik meg ugyanaz a hanghullám. Gyakorlatilag semmiben sem különbözik a monótól, csupán kétszer annyi helyet foglal.

Így néz ki egy monó hangfájl szinusza:

 

 A középső piros vonal a nullpontot jelképezi, a szinuszgörbe pedig a hanghullám grafikus rajzolata.

Ilyen egy álsztereó hangfájl:

 Igazából ez is monó

Ilyen egy sztereó hangfájl:

 

A képen világosan látható, hogy a két oldal hanghullámai frekvenciájukban eltérnek. Az alsó szaporább, abban egy magasabb hang szólal meg. És amint nagyon szemléletesen láthatjuk: a nagyobb frekvenciájú hullámnak kisebb a hossza, mint a kisebb frekvenciájúnak. Így máris igazolást nyert a fenti állításom, hogy a hullámhossz és a frekvencia fordítottan arányosak egymással. Aki nem hiszi, vegyen elő egy centit és mérje meg a képen látható hullámok hosszát! :D

A hullámoknak van egy érdekes tulajdonságuk. Amikor több hullám találkozik egymással, összekeverednek. Az azonos irányú és fázisú, valamint azonos frekvenciájú hullámok felerősítik egymást. Az azonos frekvenciájú, de eltérő irányú (és/vagy fázisú) hullámok azonban kioltják egymást.

Hanghullámok ellenfázisban:

 

Ha mindezeket megértettük, akkor elkezdhetünk foglalkozni egy könnyűzenei szám felépítésével. A zenét általában hangszerenként külön sávokra rögzítik. Ez akkor is így van, ha a zenekar úgy dönt, hogy szimultán veszi fel a zenét, és egyszerre játszanak, nem külön-külön. A legtöbb hangszert egyszerűen monóban veszik fel. Hogy miért? Azért mert egy hangforrás van, akár trombita, akár nagybőgő szól. Viszont később ezeket a hangszereket el lehet helyezni a sztereó térben a panorámázással. Fokozatosan lehet az egyik vagy másik oldal felé tolni a sok sok hangszert, egyiket jobban, a másikat kevésbé, egyiket jobbra, a másikat balra; így alakul ki, a kellemes, sztereó hangkép végül.

Meg kell azonban értenünk, hogy a könnyűzenében vannak hangszerek, amelyeket nem panorámázhatnak el a sztereó térben egyik irányban sem, mivel csorbulhatna a mű élvezhetősége. Ezek a dolgok tehát középen maradnak. Felsorolom a hangszereket, amelyek (általában) tipikusan középen szólnak 0 panorámával.

Basszus — lényegtelen, milyen hangszerrel játsszák. Lehet nagybőgő, basszusgitár és lehet szintetizátor. A basszussáv általában monóban középen marad.

Lábdob — dance és egyéb elektronikus zenében ő a basszus dobhang. Élő dobfelszerelésnél a cucc kellős közepén foglal helyet. Furcsa lenne, ha valamelyik oldalra eltolnák.

Pergő — elektronikus zenében nem sok jelentősége van, élő dobnál annál több. A pergő elvileg a lábdob mellett helyezkedik el közvetlenül, nem igazán tolható el egyik irányba sem. Talán egy hangyapucányit, de az nem számít.

Gitár-, szaxofon-, herfli- és egyéb szólók a zenében — az esetek 99%-ában középről szólnak, hacsak nincs páros szóló más hangszerrel, ahol ki lehet aknázni a sztereó adta lehetőségeket. Önmagában általában középen szól.

Szólóének, avagy főének — ő is monóban van a felvétel közepén.

Az összes többi hangszer a sztereó térben el van tolva egyik vagy másik irányban többé vagy kevésbé. Ez teszi lehetővé, hogy a zenét megtisztítsuk az énektől.

Amint fent említettem, az eltolt fázisú, vagy ellenkező fázisba fordított, azonos amplitúdójú és frekvenciájú hangok kioltják egymást, és a hang elnémul. Ha van egy olyan erősítőnk, amin van egy sztereó/monó kapcsoló, a monóra kapcsolással máris elértük a kívánt eredményt. Amennyiben nincs, beavatkozásra van szükség. Ehhez egy hangszerkesztő program kell, vagy DJ-pult, ami rendelkezik egy fázisfordítóval. Mi maradunk a hangszerkesztőnél.

A művelet a következőképpen történik. Kijelöljük a sztereó hangfájl egyik oldalát, tökmindegy, hogy melyiket. Ezután ezt a csatornát invertáljuk. Majdnem minden hangszerkesztő képes erre. Ha ez megvan, már csak monóvá kell konvertálnunk a sztereó hangfájlt. Készen is van a házilag készített karaoke számunk. Hátra van azonban a fekete leves!

Amint említettem, ezzel a módszerrel az összes monó hangot, vagyis a panorámatérben a 0 pozícióban elhelyezkedő hangot kiirtjuk a zenéből. És ez nem csak az ének lesz. A fent felsorolt hangszerek és hangok mindegyike elhallgat. Eltűnik ugyan az ének, viszont eltűnik a basszus, a lábdob, a pergő, és a szólóhangszerek többsége is! Megmaradnak a kísérőhangszerek, a dobok közül a tamok, mert azok a pozíciójuknak megfelelően el vannak helyezve a sztereó térben; a cinek, mert azokat két belógatott (overhead) kondenzátormikrofonnal sztereóban rögzítik, ezeken kívül általában a háttérvokálok is megmaradnak, mert azokat — ellentétben a szólóénekkel — szét szokták panorámázni. Adtunk tehát a szarnak egy pofont, hogy ilyen profánul fejezzem ki magam.

A dolgot tovább bonyolítja, hogy a hangszerek ritkán szólnak effekt nélkül, kvázi meztelenül. Az énekre gyönyörű sztereó zengetőt szoktak rakni. Nem minden zenéből hallatszik ki, és általában műfajfüggő, mennyire van megzengetve az ének. Az élő dobok atmoszféráját manapság egy szoba mikrofonnal veszik fel. Ez az ún. room-mikrofon sztereó, és a dobszerkó elé rakják, ezzel a szoba atmoszféráját felveszik, amit hozzákevernek a dobokhoz. Ez adja meg az egész teltségét. A legjobban csillapított dobszobának is van minimális utánzengése, a legkisebbek körülbelül 600-800 ms körül mozognak. És ez egy sztereó zengés. Az elektronikus zenei dobokra általában semmilyen zengetőt nem raknak. Azok csupaszon szólnak, bár itt is az adott műfaj és a zeneszerző dönti el, mit csinál. Kötött szabályok nincsenek. A szólókra általában sztereó visszhang effekt kerül (némi finom zengető kíséretében), ami egyre halkabban ismétli a hangot. Ez lehet ún. pingpong delay, ami az egyik oldalról a másikra ugrál, vagy más idő tartomány van megadva mindkét oldalnak. Mondjuk 350 ms a jobbnak, és 500 ms a balnak. Ez szintén a sztereó élmény fokozására készül így. A rossz hír az — ha egyáltalán még lehet fokozni —, hogy mivel ezek az effektek sztereó jelet közvetítenek, ezek minden mesterkedésünk ellenére is megmaradnak a zenében. Képzeljük el a zenét, hogy dob nincs benne, csak a szobamikrofon nem túl kellemes zengése. Ének sincs, csak a "kísértete", azaz a zengetője. Az továbbra is hallatszani fog. No, és igen idegesítően, a szólóhangszer nem hallatszik, hallatszik viszont a ráadott kettős visszhang, és mivel visszhangról van szó, időben igencsak késik a zenéhez képest, tovább növelve a zenei katyvaszt, amit elkövettünk.

Az acapella (a szólóének önmagában) kinyerése a zenéből ugyanígy történik, csak sokkal bonyolultabb, mert itt a sztereó hangokat kell eltüntetni, és a monók megmaradnak. Ez már egyszerű hangszerkesztővel nem is készíthető el, csak amihez van megfelelő algoritmus írva. És ez az acapella sem lesz egy szemmel sem különb, mint a karaokénk.

 

Akkor mégis hogy csinálják a tévékben és a karaoke-bárokban, vagy a kocsmákban a karaoke-gépek?

 

 

Most ki fogok néhány emberkét ábrándítani. Talán nem árulok el nagy titkot, ha elmondom, hogy a tévéstúdiók az ilyen nagyszabású műsorok készítésénél alaposan a zsebbe nyúlnak. Csak a legtehetősebb tévék engedhetik meg azt maguknak, hogy megvásárolják az eredeti dal ének nélküli változatát és sugározzák, vagy pedig, ha valami okból ez nem kivitelezhető, mert mondjuk olyan régi a zene, hogy az eredeti felvételek már nincsenek meg, akkor egy profi session zenészekből álló társasággal stúdióban újra feljátsszák a számot. Természetesen ehhez is ki kell fizetni az átdolgozás licencét; ha már adásba megy a dolog igencsak zsebbe nyúlós. A DJ-k számára néhány zenekar külön készít ének nélküli lemezeket, és zenekari kíséret nélküli énekből álló anyagokat, amelyek szintén elég drágák, amellett ritkák is, mert nem minden zenekar szeretné feltétlenül, ha a DJ megmixelné őket. A Slayer például szvsz igencsak zokon venné. :))

 

És a karaoke gépek? Azokkal mi van?

 

Azokkal az van, hogy nem az eredeti zenét játsszák le, hanem egy MIDI változatot. Jótékony és műkedvelő emberkék, sokszor az átdolgozási licencre és copyrightra fütyülve szépen elkészítik otthon a dal MIDI változatát. Ez egy gyakorlott zenésznek nem kihívás. Majd ezeket vagy pénzért árulják, vagy szabadon osztogatják. Bár úgy tudom, pontosan azért használnak MIDI alapú karaoke programokat ezek a gépek és a kocsmák, mert a MIDI feldolgozás nem számít teljes értékűnek, így a bárokban nem kell minden lejátszott dal után szerzői jogdíjat fizetni. Ezeket igen buta szoftverekkel játsszák le, amelyek nem képesek virtuális hangszereket megszólaltatni, csupán a hangkártyába beleégetett MIDI hangkészletet használják a hangok lejátszásához. Ez pedig többnyire borzalmas, és kiábrándító. Mindazonáltal az ének gyakorlásához megfelelő kompromisszum lehet. És gyakorlatilag minden szám elérhető egy kis keresgéléssel a neten MIDI formátumban. Akkor már csak egy karaoke-programot kell telepítenünk, betárazni a dalokat, és elkezdeni az ének gyakorlást. Előtte kérjünk elnézést a szomszédoktól természetesen.

Én tehát azt ajánlom, hogy ne kísérletezgessünk wavból kipucolni az éneksávot, mert úgysem lehet. Az ének gyakorlásához keressünk egy ingyenes kis karaoke szoftvert, és jöhet a mehet.

Sajnálom, ha néhányakat, akik itt keresték a megoldást, kiábrándítottam, de a cikk elején világosan leírtam, hogy ezt fogom tenni. A továbbra is tudálékoskodóknak és akadékoskodóknak nyugodtan lehet ezt az írást terjeszteni; ha ez sem használ, hagyjuk őket nyugodtan pepecselgetni. Csak a saját idejüket vesztegetik.

Én viszont ezzel egyszer s mindenkorra lezártam a téma magyarázását. Gratulálok annak, aki végig bírta olvasni!

Forrás: saját kútfő. Ha valamiben tévedtem volna, a szakmabeliek nyugodtan kijavíthatnak; mivel nem tanult szakmám, nem veszem zokon.

6 komment

A bejegyzés trackback címe:

https://bonfire.blog.hu/api/trackback/id/tr72306495

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

TiSza 2010.09.21. 13:31:49

A cím és az indítás jó átverős :-))) Kíváncsivá tettél, hogy is lehet ezt megoldani. Mert bár ilyen teljes fizikai ismereteim nincsenek a témáról, de az a kevés, ami van, abba az irányba mutatott, hogy egy zenéből nem lehet kivenni tisztán csak az éneket.
"...oly sokan kérdezik, hogy hogyan kell ezt csinálni, és én már annyiszor elmagyaráztam különböző fórumokon a műveletet... Ezért úgy döntöttem, írok egy blogposztot a témáról, hogy legyen honnan belinkelni az általam és mások által milliószor leírt technikákat" - ez számomra azt jelentette, hogy most majd megmagyarázod, amit lehetetlennek véltem. A technikákat :-) Végig is rágtam becsülettel, meg is értettem.

Egyébként is: fenébe a karaokéval!

BonFire 2010.09.21. 14:55:04

Akkor egy embernél már elérte a célját, bár nem kimondottan neked szántam. A pcfórumon szokott feljönni a téma, átlagonsan kéthetente egyszer. És bár én általában türelmes ember vagyok, akkor sem szeretem 100× leírni ugyanazt, ha éppen szakértői pontot lehet érte kapni.

Azt kéri a csávó, hogy hogy lehet – most figyelj – az éneksávot kinyerni! úgy, hogy a zene megmaradjon. Err belinkeltem neki az összes kimondottan pcfórumos találatot, így: "acapella inurl:pcforum.hu". Ez egy elég konkrét keresés. Erre visszaír, hogy ő nem ezt akarja, hanem "levenni" az éneket, hogy csak a zene maradjon. Mondom, az pont az ellenkezője, kispajtás, mint amit tegnap kértél, és semmi más dolgod nem lett volna, mint a tőlem kapott keresőkifejezést (ha már a Google operátorokat nem tanítják az iskolában) acapelláról átírja egyszerűen erre "karaoke inurl:pcforum.hu" De azért ezt is belinkeltem neki, és elétettem.

Emellett kifejtettem neki a fentieket dióhéjban újra, de még csak el sem olvasta. Sem a keresés találatait, holott azokban ott volt a válasz, sem amit leírtam.

Ezután nem fogok senki után guglizni, sőt, az ilyennel csak így fogok egyszerűen válaszolni, hogy: [url=http://bonfire.blog.hu/2010/09/19/karaoke_es_acapella_keszitese_zenebol]ÍGY[/url].

Szépen belinkelem nekik, aztán izzadjanak. Én sem vagyok sem fizikus, sem matematikus, de ezeket az alapvető dolgokat még nekünk általános iskolában megtanították. Jó, jó, nem volt számtech, info és egyebek, de azért aki csak egy kicsit is a hanggal szeretne foglalkozni, annak ezt meg kellene tanulnia. Ez a minimum. Hogyan fogja akkor egy Flanger, Kórus, vagy Phaser effekt működését megérteni? Meg a többit?

Dumabomber 2011.05.12. 15:03:32

Amit írsz, majdnem igaz, de azért ezt érdemes lenne kipróbálnod:
www.celemony.com/cms/index.php?id=demo_studio

BonFire 2011.05.12. 18:00:36

@Dumabomber: Ismerem a Melodyne-t, de nagyobb a füstje, mint a lángja. Tipikus demó-maszlag. A demófájlokkal gyönyörű a prezentáció, egy eltérő fájlnál viszont elvérzik. Elég csak egy rekedt hangú éneke, mint pl Charlie, és rögtön nem ismeri fel a hangmagasságot, illetőleg korrigálni sem lehet vele. A Direct Note Access sem szedi szét olyan szépen az akkordokat, ahogy be van mutatva. Kipróbáltam mind gitárral, mind zongorával, és csupa hülyeséget művelt. Én személy szerint nem tudom mire használni a Melodyne-t. Ha éneket kell javítani, más szoftvereknek van saját pluginja erre a feladatra. Mind a Cubase-nek, mind a Sonarnak.

A Melodyne-t még faragni kell. Emellett a kezelése is eléggé fapados.

MammyPress Média 2015.07.14. 13:09:43

Én viszont végre nem csak tudok néhány dolgot a hangról, hanem meg is értettem. Szóval: köszönöm!
süti beállítások módosítása