Egy háromórás felvétel mérete 192 kbps. A leggyakoribb tévhitek a digitális hangról

Egy háromórás felvétel mérete 192 kbps.  A leggyakoribb tévhitek a digitális hangról
Egy háromórás felvétel mérete 192 kbps. A leggyakoribb tévhitek a digitális hangról

Az MP3 fájlformátum az ún. nyílt formátum”, amelyet a legtöbb gyártó támogat.

Az MP3 formátum az egyik legszélesebb körben használt digitális hangkódolási formátum. Az MP3 hangkódolás egyik jellemzője a veszteséges kódolás. A kódolás azonban egy speciális modellen alapul, amely figyelembe veszi az auditív észlelés sajátosságait. Ezért a veszteségek jelenléte nem vezet katasztrofális hangromláshoz.

Az MP3 fájlok de facto szabvánnyá váltak, és a legtöbb népszerű operációs rendszer, számos CD- és DVD-lejátszó, valamint egyéb eszközök támogatják őket.

Érdekes módon a szabvány magát a tárolási formátumot írja le, és nem a hang kódolási módját. Emiatt rengeteg olyan eszköz létezik, amelyek MP3 formátumú hang lejátszására szolgálnak.

Speciális kodekeket használnak a hang MP3 formátumú kódolására.
Az audiokodek két típusba tartozhat: hardveres kodekek és szoftveres kodekek.

A hardveres kódolás speciális chipek segítségével történik.
A programkódolás speciális számítógépes programokkal történik.

Az MP3 formátumú hangminőség (ceteris paribus) a tömörítés mértékétől (olvassa el a veszteség mértékét) és a kódoló programtól függ. Éppen ezért kodekeket és audiojel-feldolgozó rendszereket használó márkás lejátszók híres márkák, lejátszási minőségét tekintve jelentősen felülmúlják a szabványos csomópontokból összeállított hagyományos eszközöket.

A tényleges lejátszás minősége a médiáról érkező adatfolyam méretétől függ. Néha az adatfolyam méretét folyamszélességnek nevezik. Van egy speciális kifejezés - bitráta. Az adatsebesség kilobit/s-ban van megadva, és kbs, kbps, kb/s jelöléssel történik. Egy felvétel többféleképpen kódolható – állandó és változó bitrátával. A változó bitsebesség az adatmennyiség növelésével segít megőrizni a részleteket.

Mert minőségi zenelejátszás Nem minden adatsebesség megfelelő Lásd 1. táblázat

MP3 bitsebességek és alkalmazások

Asztal 1

Az 1. táblázatban szereplő adatok csak tájékoztató jellegűek. Az a tény, hogy az MP3 formátum megjelenése idején a tömegpiaci audioberendezések minősége nem volt túl magas. Számos tekintélyes publikáció komolyan állította, hogy a 128 kb/s-os adatfolyam elegendő a jó minőségű hangvisszaadáshoz.

Jelenleg a legalább 192 kb/s bitsebesség számít jó minőségűnek. Ezen túlmenően a Hi-Fi, Hi-End és házimozi rendszerek széles körben elterjedt elterjedése a kiváló minőségű hangvisszaadás irányába történő hatalmas elmozduláshoz vezetett.

Ezért a hangvisszaadás hibái, amelyek a múlt költségvetési berendezésein észrevehetetlenek, észrevehetők a „felkészületlen hallgató” számára a modern, kiváló minőségű berendezések használatával. Ennek a nagyon „felkészületlen hallgatónak” a szintje egyébként jelentősen megnőtt.

Általánosságban elmondható, hogy a tömörítés (és különösen a veszteséges tömörítés) ötlete fokozatosan elavulttá válik. Megjelenik a korszakban drága adathordozóÉs kicsi sávszélesség adatcsatornák, az adattömörítés ötlete tökéletesen tette a dolgát. Fokozatosan azonban a hang szerelmesei magasabb bitrátára váltanak (a tömörítéshez kevesebb veszteség), vagy akár teljesen veszteségmentes vagy akár tömörítetlen tömörítési formátumok is.

A tömörített formátumok praktikussága, és különösen az MP3 formátum, a memóriachipekre vagy miniatűr merevlemezekre épülő kompakt MP3-lejátszók megjelenéséhez vezetett.

Egy ilyen lejátszó egyik vagy másik modelljének kiválasztásakor felmerül a kérdés a memória mennyiségével kapcsolatban. Természetesen a felhasználó előre meg akarja becsülni, hogy mennyi zenei anyagot tud egyszerre tárolni MP3 lejátszóján.

A fájlok hangerejének és a hang időtartamának hozzávetőleges adatait a 2. táblázat gyűjti össze. A 2. táblázat használatakor vegye figyelembe, hogy ezek hozzávetőleges adatok, amelyek lehetővé teszik a lejátszókhoz vagy a cserélhető adathordozókhoz szükséges memóriamennyiség becslését.

MP3 hossz és tömörítési arány

2. táblázat

bitráta,
kb/s

1 perces felvétel
KB

Alapértelmezett
3 perces kompozíció,
MB

Alapértelmezett
4 perces kompozíció,
MB

Alapértelmezett
5 perces kompozíció,
MB

Megjegyzés a 2. táblázathoz
A magas tömörítés 56 kb/s-nak, az alacsony tömörítés és a jó hangminőség 320 kb/s-nak felel meg

A 3. táblázat tájékoztató jellegű adatokat közöl a zenei felvételek teljes hosszáról - a lejátszó játékideje egy vagy több memóriával.

Az MP3 lejátszó teljes lejátszási ideje a memória méretétől függően

3. táblázat

Hang időtartama

memória,
GB

Bitráta, kb/s

percek
Órák

percek
Órák

percek
Órák

percek
Órák

percek
Órák

percek
Órák

Amint a 3. táblázatból látható, 8 GB elegendő a legjobb minőségű MP3-felvételek tárolására napi 8 órás hallgatásra alkalmas mennyiségben egy héten (7 napon keresztül). Nincs ismétlés! Igazából aligha van valakinek ilyen igénye.

Még ha ez a helyzet is, akkor legfeljebb hetente frissítheti a lejátszó rekordjait.

2013-as oldal. Minden jog fenntartva.

Találkozunk a weben!

A Wi-Fi bekapcsolása Asus laptopon
Vista - lemezterület felszabadítása
3G MTS modem csatlakoztatása
MP3 fájlok hangereje és minősége
MP3 lejátszó kiválasztásának módszerei és gyakorlata, 1. rész
MP3 lejátszó kiválasztásának módszerei és gyakorlata, 2. rész
Vista - hogyan lehet megnyitni egy parancssort egy mappában
Hogyan lehet fájlneveket nyomtatni egy mappából
Hogyan lehet fájlneveket szövegként menteni
Fájlnevek másolása MS Excelben
LED USB zseblámpa
A fejhallgató készüléke és kialakítása
Hogyan válasszunk fejhallgatót?
Mi tartja fent a párnákat?
Gadget teljesítmény - akkumulátorok
SIM-kártya méretei
Gadget tápellátás - dugók és aljzatok
Gadget táp - adapterek

Mi az egyik leggyakoribb és legmélyebben gyökerező tévhit az audiofil világban?

Mentse el és olvassa el később -

Jegyzet. fordítás: Ez Christopher "Monty" Montgomery (az Ogg Free Software és a Vorbis alkotója) kiterjesztett cikkének második (négyből) fordítása, amely szerinte az egyik leggyakoribb és legmélyebben gyökerező tévhit az audiofilekben. világ.

A 192 kHz-es frekvencia káros

Zenei digitális fájlok 192 kHz-en nem nyújtanak semmilyen előnyt, de mégis van némi hatása. A gyakorlatban kiderül, hogy a lejátszási minőségük valamivel rosszabb, és lejátszás közben ultrahanghullámok lépnek fel.

Mind az audio-átalakítók, mind a teljesítményerősítők érzékenyek a torzításra, és a torzítás gyorsan felhalmozódik magas és alacsony frekvenciák. Ha ugyanaz a hangszóró reprodukálja az ultrahangot a hallható tartományból származó frekvenciákkal együtt, akkor bármely nemlineáris jellemző az ultrahang tartomány egy részét a hallható spektrumba tolja el véletlenszerű, ellenőrizetlen nemlineáris torzítások formájában, amelyek lefedik a teljes hallható hangtartományt. A végfok nemlinearitása ugyanilyen hatással jár. Ezeket a hatásokat nehéz észrevenni, de a tesztek megerősítették, hogy mindkét típusú torzítás hallható.

A fenti grafikon a 30 kHz-es és 33 kHz-es audio intermodulációból eredő torzítást mutatja egy elméleti erősítőben 0,09% körüli állandó THD-vel. A torzítás a teljes spektrumban látható, még alacsonyabb frekvenciákon is.

A nem hallható ultrahanghullámok hozzájárulnak az intermodulációs torzításhoz a hallható tartományban (világoskék terület). Azok a rendszerek, amelyeket nem ultrahang reprodukálására terveztek, általában magasabb, körülbelül 20 kHz-es torzítást mutatnak, ami tovább hozzájárul az intermodulációhoz. A frekvenciatartomány ultrahangra való kiterjesztése kompromisszumokat igényel, amelyek csökkentik a zajt és a torzítási aktivitást a hallható spektrumon belül, de mindenesetre az ultrahangos komponens szükségtelen reprodukálása rontja a reprodukciós minőséget.

Számos módja van a további torzítások elkerülésére:

  1. Csak ultrahangos hangszóró, erősítő és jelspektrumosztó a nem hallható ultrahang elkülönítésére és önálló reprodukálására, így az nem befolyásolja a többi hangot.
  2. Erősítők és átalakítók szélesebb frekvenciaspektrum reprodukálására, hogy az ultrahang ne okozzon hallható nemlineáris torzítást. A többletköltségek és a végrehajtás bonyolultsága miatt további frekvenciatartomány csökkenti a lejátszás minőségét a spektrum hallható részén.
  3. Jól megtervezett hangszórók és erősítők, amelyek egyáltalán nem reprodukálják az ultrahangot.
  4. Kezdetnek nem lehet ilyen széles frekvenciatartományt kódolni. Nem lehet (és nem is szabad) hallania az ultrahangot nemlineáris torzítás a hallható frekvenciasávban, ha nincs benne ultrahang komponens.

Mindezek a módszerek ugyanannak a problémának a megoldására irányulnak, de csak a 4. módszernek van értelme.

Ha érdekelnek a saját rendszeredben rejlő lehetőségek, a következő minták a következőket tartalmazzák: 30kHz-es és 33kHz-es hang 24/96 WAV formátumban, hosszabb FLAC-verzió, néhány dallam, valamint normál dalok 24kHz-re beállított vágása, hogy azok essen. teljes mértékben a 24 kHz és 46 kHz közötti ultrahang tartományban.

Tesztek a nemlineáris torzítás mérésére:

  • 30 kHz hang + 33 kHz hang (24 bit / 96 kHz)
  • Dallamok 26 kHz - 48 kHz (24 bit / 96 kHz)
  • Dallamok 26 kHz - 96 kHz (24 bit / 192 kHz)
  • Összeállítás 24 kHz-en (24 bit / 96 kHz WAV) remasterált dalokból (a válogatás eredeti verziója) (16 bit / 44,1 kHz WAV)

Tételezzük fel, hogy a rendszere képes minden formátum lejátszására 96 ​​kHz-es mintavételi frekvenciával. A fenti fájlok lejátszásakor ne halljon semmit, ne halljon zajt, ne fütyüljön, ne kattanjon vagy más hangot ne halljon. Ha hall valamit, akkor a rendszer nemlineáris választ ad, és hallható, nem lineáris torzítást okoz az ultrahangban. Legyen óvatos a hangerő feltekerésekor, ha a digitális vagy analóg vágás területére kerül, még ha lágy is, hangos intermodulációs zajt okozhat.

Általában nem biztos, hogy az ultrahangból származó harmonikus torzítás hallható lesz egy adott rendszeren. A bevezetett torzítások lehetnek jelentéktelenek és meglehetősen észrevehetők is. Mindenesetre az ultrahangos komponens soha nem erény, és sok audiorendszerben a hangvisszaadás minőségének súlyos romlásához vezet. Azokban a rendszerekben, amelyekben nem okoz kárt, az ultrahang feldolgozásának képessége megmarad, vagy ehelyett felhasználhatja az erőforrást a hallható tartomány hangminőségének javítására.

A diszkretizálási folyamat félreértése

A diszkretizációs elmélet gyakran értelmezhetetlen a jelfeldolgozás kontextusa nélkül. És nem meglepő, hogy a legtöbb ember, még a kiváló PhD-k is más területeken, általában nem értik ezt. Az sem meglepő, hogy sokan észre sem veszik, hogy félreértik.

A mintavételezett jeleket gyakran szaggatott létraként ábrázolják, amint az a fenti ábrán látható (pirossal), ami úgy néz ki, mint az eredeti jel durva közelítése. Ez az ábrázolás azonban matematikailag pontos, és analóg jellé konvertálva a grafikonja sima lesz (kék vonal az ábrán).

A leggyakoribb tévhit az, hogy állítólag a diszkretizálás durva folyamat, és információvesztéshez vezet. A diszkrét jelet gyakran az eredeti tökéletesen sima hullám szaggatott, szögletes lépcsőzetes másolataként ábrázolják. Ha így gondolja, akkor feltételezheti, hogy minél nagyobb a mintavételi sebesség (és minél több bit egy mintán), annál kisebbek lesznek a lépések és annál pontosabb a közelítés. A digitális jel egyre inkább az analóg jel alakjához fog hasonlítani mindaddig, amíg fel nem veszi alakját a végtelenbe hajló mintavételezési frekvenciával.

Hasonlatosan, sok olyan ember, aki nem vesz részt a digitális jelfeldolgozásban, az alábbi képre nézve azt mondja: „Wow!” Úgy tűnhet, hogy egy diszkrét jel nem mutat jól magas frekvenciák analóg hullámforma, vagy más szóval a hangfrekvencia növekedésével a mintavételi minőség romlik, és a frekvenciaválasz romlik vagy érzékennyé válik a bemeneti jel fázisára.

Ez csak így néz ki. Ezek a hiedelmek tévesek!

2013. 04. 04-i megjegyzés: Válaszként a digitális jelekkel és lépésekkel kapcsolatos összes levélre, amit kaptam, megmutatom a valós viselkedést digitális jel valódi hardveren a Digital Show & Tell videónkban, szóval ne fogadd el a szavamat.

A Nyquist-frekvencia (a mintavételi frekvencia fele) alatti összes jelet tökéletesen és maradéktalanul rögzíti a mintavételezés során, és ehhez nincs szükség végtelenül magas mintavételi frekvenciára. A mintavétel nem befolyásolja a frekvenciamenetet vagy a fázist. Az analóg jel veszteség nélkül visszaállítható - ugyanolyan sima és szinkron, mint az eredeti.

A matematikával nem lehet vitatkozni, de mik a nehézségek? A legismertebb a sávszélesség-korlátozás. A Nyquist-frekvencia feletti frekvenciájú jeleket mintavételezés előtt szűrni kell, hogy elkerüljük az aliasing okozta torzulást. Ez a szűrő a hírhedt élsimító szűrő. A mintavételezési zajelnyomás a gyakorlatban nem lehet tökéletes, de a modern technológia lehetővé teszi, hogy nagyon közel kerüljön az ideális eredményhez. És elérkeztünk a túlmintavételhez.

Túlmintavétel

A 48 kHz feletti mintavételi frekvencia nem kapcsolódik a nagy hűségű hangvisszaadáshoz, de bizonyos modern technológiákhoz szükségesek. Közülük a túlmintavétel (resampling) a legjelentősebb.

Az újramintavételezés ötlete egyszerű és elegáns. Talán emlékszel a „Digitális média. Útmutató kezdőknek a Geeks számára, amely szerint a magas mintavételezési frekvencia sokkal nagyobb rést biztosít a számunkra fontos legmagasabb frekvencia (20 kHz) és a Nyquist-frekvencia (a mintavételi frekvencia fele) között. Ez lehetővé teszi az egyszerűbb és megbízhatóbb élsimító szűrők használatát, és növeli a hűséget. Ez a 20 kHz és a Nyquist frekvencia közötti extra tér lényegében csak egy lengéscsillapító az analóg szűrő számára.

A fenti ábra diagramokat mutat be a „Digitális multimédia. Geek Beginner's Guide", amely bemutatja a DAC vagy ADC átmeneti sávszélességét 48 kHz-en (balra) és 96 kHz-en (jobbra).

Ez még csak fél siker, mert a digitális szűrőknek kevesebb gyakorlati korlátja van, mint az analóg szűrőknek, a simítást pedig pontosabban és hatékonyabban tudjuk elvégezni. A nagyfrekvenciás nyers jel egy digitális élsimító szűrőn halad át, aminek nem okoz gondot a szűrő átmeneti sávjának szűk helyre illesztése. A simítás befejezése után a további különálló szegmenseket a párnázótérben egyszerűen vissza kell hajtani. A túlmintavételezett jel lejátszása fordított sorrendben történik.

Ez azt jelenti, hogy az alacsony mintavételezési frekvenciájú (44,1 kHz vagy 48 kHz) jelek ugyanolyan pontossággal, simasággal és alacsony álnévvel rendelkezhetnek, mint a 192 kHz-es vagy magasabb mintavételezési frekvenciájú jelek, de ezek egyike sem jelenik meg. intermodulációs torzítás, megnövelt fájlméret). Szinte minden modern DAC és ADC túlmintavételezett egy nagyon nagy sebességek, és kevesen tudnak róla, mert ez automatikusan megtörténik a készülék belsejében.

A DAC és az ADC nem mindig volt képes újramintavételezni. Harminc évvel ezelőtt egyes felvevőkonzolok magas mintavételezési frekvenciát használtak hangfelvételhez, csak analóg szűrőket használva. Ezt a nagyfrekvenciás jelet használták fel a mesterlemezek létrehozására. A digitális simítás és decimálás (CD és DAT esetén kisebb sebességű újramintavételezés) a felvétel utolsó lépésében történt. Ez lehetett az egyik korai oka annak, hogy a 96 kHz-es és a 192 kHz-es mintavételezési frekvenciák összekapcsolódtak a professzionális felvételkészítéssel.

16 bit vs 24 bit

Oké, most már tudjuk, hogy nincs értelme a zenét 192 kHz-en menteni. Téma lezárva. De mi a helyzet a 16 bites és 24 bites hanggal? Mi a jobb?

A 16 bites PCM hang nem fedi le teljesen azt az elméleti dinamikus hangtartományt, amelyet az ember ideális körülmények között hallhat. Vannak (és mindig lesznek) okok arra, hogy 16 bitnél többet használjunk hangfelvételhez.

Ezen okok egyikének sincs köze a hanglejátszáshoz – ebben a helyzetben a 24 bites hang ugyanolyan haszontalan, mint a 192 kHz-es mintavételezés. A jó hír az, hogy a 24 bites kvantálás használata nem rontja a hangminőséget, hanem egyszerűen nem rontja, és több helyet foglal el.

Megjegyzések a 2. részhez

6. Sok olyan rendszer, amely nem képes lejátszani a 96 kHz-es mintákat, nem utasítja el a lejátszást, hanem csendben 48 kHz-re almintavételezi őket. Ebben az esetben a hang egyáltalán nem fog lejátszani, és a rendszer nemlinearitásától függetlenül nem lesz semmi a felvételen.

7. az újramintavétel nem az egyetlen módja nagy mintavételezési sebességgel dolgoznak a jelfeldolgozásban. Számos elméleti módszer létezik a sávkorlátozott, magas mintavételezésű hang elérésére és a tizedelés elkerülésére, még akkor is, ha később lemintavételezzük a lemezre való rögzítéshez. Egyelőre nem világos, hogy a gyakorlatban alkalmaznak-e ilyen módszereket, mivel a legtöbb professzionális létesítmény fejlesztését titokban tartják.

8. Történelmileg nem számít, de sok mai szakember használja nagy felbontások, mert tévesen azt hiszik, hogy a 20 kHz-en túli tárolt tartalommal rendelkező hang jobban szól. Akárcsak a fogyasztók.

Ezt a cikket 33 932 alkalommal olvasták

Az MPEG-1 Layer 3 hangrögzítési formátum (köznyelvi nevén MP3) diadalmas menetelése annak köszönhető, hogy egy egyszerű, ill. hatékony módszer hangfájl-tömörítés, amely lehetővé teszi a szabványos tárolást CD ROM akár 12 óra elfogadható minőségű zene.

Leegyszerűsítve, az MPEG-1 Layer 3 algoritmus az úgynevezett "pszichoakusztikus" tömörítési módszeren alapul, amikor is a fül által nem érzékelhető frekvenciákat és hangerőszinteket kizárják a spektrum hangjaiból. Az így "megtisztított" spektrumot azonos időtartamú különálló blokkokra (kockákra) osztják és a meghatározott követelményeknek megfelelően tömörítik. Lejátszás közben a jel dekódolt képkockák sorozatából jön létre.

A tömörítés mértéke az audio stream paramétereitől függ, amelyet a fájl dekódolása után kimenetként kell megszerezni.

A hangminőséget és a tömörítési arányt meghatározó fő paraméter az ún. bitráta a sávszélesség, bit per másodpercben mérve.

Minél magasabb ez az érték, annál jobb a hangminőség és annál alacsonyabb a tömörítési arány. Mivel szinte minden MP3 fájlt sztereóban, 44 kHz-en és 16 biten rögzítenek, a tiszta hangzás meghatározó tényezői: a felvételi forrás, a használt kodek és a kiválasztott bitsebesség.

A codec szót a kódoló + dekódoló szavak kombinációja alkotja. Ez egy szoftvermodul, amely lehetővé teszi audio- vagy videofájlok kódolását vagy dekódolását saját algoritmusa szerint.

A 256 Kbps-os átlagos adatfolyam-érték körülbelül 6:1-es tömörítési arányt biztosít, más értékeknél a tömörítési arány arányosan változik. Így egy 256 Kbps adatfolyammal hat közönséges Audio CD-ről írhat zenét CD-re, 128 Kbps adatfolyammal pedig tizenkét közönséges zenei lemezről.

Az amatőrök és a profik között végtelen viták folynak a jó hangminőséget biztosító bitráta értékről, amely megfelel az Audio CD-lejátszás minőségének.

Néhány elegendőnek tartjuk a szint 128 Kbps, másokat csak a folyam maximális értéke elégít ki - 320 Kbps. Minden valószínűség szerint mindkettőnek igaza van – az egyetlen különbség az, hogy mit rögzítenek, és milyen feltételek mellett reprodukálják.

A digitalizált hangot kódoló bitsebesség általában a CD borítóján van feltüntetve. Például, teljes gyűjtemény A Beatles zenéje három lemezen érhető el 128 kbps sebességgel vagy hat lemezen 256 kbps sebességgel.

Nyilvánvaló, hogy a második esetben a vételár kétszer olyan drágább lesz, de a minőség jobb.

Ha egy hazai autóban szól a zene, akkor a 192 Kbps-os adatfolyam megfelelő hangminőséget biztosít, a külső zajok miatt mégsem fog a legjobban hallani. Számítógépen vagy önálló lejátszón történő zenehallgatáshoz ( MRZ-lejátszó) 256 Kb/s adatfolyam elfogadható.

De ha a jel változtatások nélkül kerül be a külső eszközbe, és kiváló minőségű hangszórókra kerül, akkor a lehető legnagyobb adatfolyam kívánatos - 320 Kbps. A fenti megfontolások alapján egy 256 Kbps-os adatfolyam univerzálisnak tekinthető: jó felvételi minőség mellett a legtöbb esetben megfelelő lejátszást biztosít.

Zene interneten keresztüli sugárzásához általában 128 Kbps adatfolyam-értéket használnak. Ugyanakkor a hangminőség „mintha” sok kívánnivalót hagy maga után.

192-256 Kbps feletti bitrátával népszerű zenét rögzíteni nincs értelme: a dalok nem élnek sokáig, és az eredeti felvételek gyakran nem jó minőségűek. A végén táncolhatsz a "szalagos" minőség hangjára.

Egészen más dolog a klasszikusok és a ritka szerzői munkák. Klasszikus alatt pedig nem csak Bachot vagy Mozartot értjük. Ma a The Beatles, a Led, a Zeppelin, a Viszockij, a Tsoi és sok más szerző (előadó) tekinthető klasszikusnak.

Ha CD vásárlásakor nem figyelt a csomagoláson feltüntetett bitráta értékre, akkor fájllejátszás közben a lejátszó sorában láthatja az értéket.

Bitráta (angolból. bitráta) hangfájlok száma a hangfelvétel egy másodpercének tárolására használt bitek (információs egységek) számát jelenti. A bitsebesség leggyakoribb mértékegysége a kilobitek száma másodpercenként (Kbps, Kbps). A bitsebesség a multimédiás fájlok egyik legfontosabb jellemzője, amely befolyásolja azok minőségét és méretét. Minél nagyobb bitrátájú zenét vagy videót rögzítettek, annál jobb lesz a minőségük, és annál "nagyobb" a felvételi fájlok.

Ennek megfelelően a bitsebesség értékének egyik vagy másik irányba történő megváltoztatása növelheti vagy csökkentheti a fájlméretet. De a felvételek minőségére gyakorolt ​​hatással minden egy kicsit bonyolultabb. Míg a bitsebesség csökkentése természetesen a forrásfájl minőségének romlásához vezet, az ellenkező művelet semmilyen módon nem befolyásolja a minőséget. Még ha beállítja is a maximális bitrátát, a fájl hang- és képminősége változatlan marad.

Amint látja, nincs értelme a felvételi bitrátát növelni: ennek eredményeként egy nagyobb, azonos minőségű fájlt kap. De a bitráta csökkentése a rekord méretének csökkentése érdekében nagyon lehetséges. Szeretné megváltoztatni dalai vagy filmjei bitrátáját? Movavi Video Converter letöltése - kényelmes program, mellyel könnyedén módosíthatja a videó- ​​és hangfelvételek bitrátáját, legyen szó népszerű MP3, WMA, AVI és MP4 formátumú fájlokról vagy egzotikusabb konténerekben elhelyezett felvételekről. Az utasítás az audio fájlokkal való munka példájára íródott.

1. Telepítse a programot a bitsebesség megváltoztatásához

Töltse le és futtassa a Movavi Video Converter terjesztését. A program telepítéséhez kövesse a képernyőn megjelenő utasításokat. A telepítés befejezése után a konverter automatikusan elindul.

2. Adjon hozzá fájlokat a programhoz

Kattintson a gombra Fájlok hozzáadása, Válasszon ki egy elemet Hang hozzáadásaés helyezze be a szükséges fájlokat a programba. A program számos médiaformátumot támogat, így a bemeneti fájlok formátuma szinte bármilyen lehet. Módosítsa az MP3, WMA, AAC és más hangfájlok bitrátáját. Próbálja csökkenteni a videó bitsebességét: dolgozzon AVI, MP4, DIVX és különféle HD videó formátumú videókkal. A program a médiakonverziós feladatok széles skálájával segít megbirkózni!

3. Válassza ki a mentési formátumot

A bitsebesség módosítása előtt ki kell választania a hangfelvételek mentési formátumát. Ehhez kattintson a fülre Hangés válassza ki a megfelelő formátumot a listából. Miután kiválasztott egy vagy másik hangformátumot, kattintson a nevére, és válassza ki a rendelkezésre álló bitsebesség-értékek egyikét a legördülő listából (az opció nem érhető el FLAC, OGG, WAV és M4A formátumok esetén). Ha nem szeretné megváltoztatni a kiválasztott profilban megadott szabványos bitsebességet, akkor kihagyhatja a következő lépést, és folytathatja az átalakítást.

4. Állítsa be a kívánt bitsebességet

Kattintson a fogaskerék gombra a mező jobb oldalán kimeneti formátum. Listázott Bitráta típus válassza ki

Megbízható és hatékony HD képernyőrögzítő szoftver. Rögzítsen videókat programokból, élő adásokból, sőt Skype-beszélgetésekből, és mentse el a klipeket bármilyen népszerű formátumban, valamint mobileszközökön való megtekintéshez.

A bitrátát szokás használni egy adatfolyam effektív átviteli sebességének egy csatornán keresztüli mérése során, vagyis a csatorna minimális méretét, amely késedelem nélkül képes átadni ezt az adatfolyamot.

A bitsebességet bit per másodpercben fejezzük ki (bps, bps), valamint származékos mennyiségek kilo- előtagokkal (kbps, kbps), mega- (Mbps, Mbps) stb.

Adatsebesség bit per blokkmásodperc használatával (szimbólum: "bps"), gyakran a Nemzetközi Mértékegységrendszer (SI) előtagjaival együtt használatos, például "kilo" (1 kbps = 1024 bps), "mega" (1 Mbps = 1024 kbps) ), "giga" (1 Gbps = 1024 Mbps) vagy "tera" (1 Tbps = 1024 Gbps). A nem szabványos "bps" rövidítést gyakran használják a "bps" szabványos karakter helyettesítésére, így például az "1 Mbps" egymillió bitet jelent másodpercenként. Egy bájt másodpercenként (1 B/s) 8 bit/s-nak felel meg.

Jellemzők

A veszteséges tömörítést használó video- és audio streaming formátumokban (például MPEG és MP3) a "bitráta" paraméter az adatfolyam tömörítésének mértékét fejezi ki, és így meghatározza annak a csatornának a méretét, amelyre az adatfolyamot tömörítik. Leggyakrabban a hang és a kép bitrátáját kilobit per másodpercben mérik. kilobit per másodperc, kbps), ritkábban - megabit per másodpercben (csak videó esetén).

Három adatfolyam-tömörítési mód létezik:

  • CBR(Angol) állandó bitráta) - állandó bitrátával;
  • VBR(Angol) Változó bitráta) - változó bitsebességgel;
  • ABR(Angol) Átlagos bitsebesség) - átlagos bitsebességgel.

Információátviteli sebesség

Fizikai réteg nettó bitsebessége, információsebesség, használható bitsebesség, hasznos adatátviteli frekvencia, nettó bitsebesség, kódolt átviteli sebesség, effektív bitsebesség vagy huzalelőtolás (nem hivatalos nyelv) digitális csatorna A kommunikáció a fizikai réteg overhead protokolljának figyelembe vétele nélküli képesség, a multiplex például időosztásos multiplexelési (TDM) keretezési bitekkel, fenntartott továbbítási hibajavító (FEC) kódokkal, betanítási szimbólum-ekvalizerrel és egyéb csatornakódolással. Az Escape kódok gyakoriak, különösen a vezeték nélküli kommunikációs rendszerekben, a szélessávú modem szabványokban vagy a modern, nagy sebességű rézalapú LAN-okban. A fizikai réteg nettó bitsebessége a kapcsolati réteg és a fizikai réteg közötti interfész referenciapontján mért adatsebesség, ezért magában foglalhatja az adatkapcsolatot és a terhelési réteget is.

modemekben és vezeték nélküli rendszerek, gyakran alkalmazzák a link adaptációt (az adatsebesség és a modulációs és/vagy kódolási hibák automatikus adaptálása, jelminőség). Ebben az összefüggésben a csúcsbitráta kifejezés a leggyorsabb és legkevésbé megbízható átviteli mód nettó bitsebességét jelenti, például [amikor a távolság nagyon nagy rövidzárlat] a feladó és az adó között. Néhány OSÉs hálózati hardver képes érzékelni egy adott hálózati hozzáférési technológia vagy kommunikációs eszköz "kapcsolati sebességét" (nem hivatalos szóhasználat), amely az aktuális nettó adatsebességet feltételezi. Meg kell jegyezni, hogy egyes tankönyvekben a vonalsebesség kifejezés a bruttó bitsebességet, másokban pedig a nettó adatsebességet jelenti.

A kumulatív bitsebesség és a nettó adatsebesség közötti kapcsolat az FEC kódsebességtől függ a következők szerint.

Állandó bitráta

Állandó bitráta- a streaming adatok kódolásának egy változata, amelyben a felhasználó először beállítja a szükséges bitsebességet, amely nem változik a teljes fájlban.

Fő előnye, hogy meglehetősen pontosan megjósolhatja a végső fájl méretét.

Az állandó bitráta opció azonban nem nagyon alkalmas olyan zenei kompozíciókhoz, amelyek hangzása idővel dinamikusan változik, mivel nem biztosít optimális méret/minőség arányt.

Változó bitráta

VAL VEL változó bitráta a kodek a paraméterek (kívánt minőségi szint) alapján választja ki a bitráta értéket, és a bitráta változhat a kódolt töredék alatt. A hang tömörítésekor a kívánt bitrátát pszichoakusztikus modell alapján határozzák meg. Ez a módszer a legjobb minőség/méret arányt adja a kimeneti fájlhoz, de a pontos méretét nagyon nehéz megjósolni. A hang (vagy videó kódolás esetén a kép) jellegétől függően az eredményül kapott fájl mérete többszörösen eltérhet.

Átlagos bitsebesség

Átlagos bitsebesség konstans és változó bitsebesség hibridje: a kbps értéket a felhasználó állítja be, és a program bizonyos határok között változtatja. A VBR-től eltérően azonban a kodek körültekintően használja a lehetséges maximális és minimális értékeket, anélkül, hogy megkockáztatná, hogy túllépjen a felhasználó által megadott átlagértéken. Ez a módszer teszi lehetővé a legnagyobb rugalmasságot a feldolgozási sebesség beállításában (hang esetén ez tetszőleges szám lehet 8 és 320 kbps között, szemben a 16 többszörösével a CBR-módszerben), és sokkal nagyobb pontossággal (a VBR-hez képest) a feldolgozási sebesség előrejelzésében. a kimeneti fájlt.

MP3

MP3 veszteséges hangtömörítési formátum. A hangminőség a bitráta növekedésével javul:

  • 32 kbps - általában csak beszéd esetén elfogadható
  • 96 kbps – jellemzően gyenge minőségű beszéd- vagy hangfolyam-továbbításhoz használatos
  • 128 vagy 160 kbps - Első szint zenei kódolás
  • 192 kbps – elfogadható zenei kódolási minőség
  • 256 kbps – kiváló minőségű zenei kódolás
  • 320 kbps – az MP3 szabvány által támogatott legmagasabb kódolási minőség

Egyéb hang

  • A 700 bps a legalacsonyabb bitsebesség, amelyet a Codec2 beszédkodek használ nyitott állapotban forráskód; a hang alig felismerhető, az 1,2 kbps bitráta sokkal jobb hangzást ad
  • 800 bps - a beszédfelismeréshez szükséges minimális szint, speciális FS-1015 beszédkodekekben használatos
  • 2,15 kbps a nyílt forráskódú Speex kodek minimális bitsebessége
  • 6 kbps a nyílt forráskódú Opus kodek minimális bitsebessége
  • 8 kbps - telefon hangminőség beszédkodekek használatával
  • - digitális kiváló minőségű audio formátum DVD-n. A DVD-Audio nem videóhoz készült, és nem azonos a videolemezekkel.

Itt megnézzük, hogyan válasszuk ki a megfelelő bitsebességet az internetes adáshoz. Tehát a bitráta a videó minősége. Minél magasabb, annál jobb a minőség. Ha jó minőségű streamet készít egy nagyszerű képpel, akkor csak növelnie kell a bitrátát, és ennyi? Bármennyire. A stream stream ezután felmegy online, illetve ezt a nagy bitrátát elfoglalja az internetes csatorna, és lehetetlen lesz megnézni. Ezért figyelembe kell vennie az internet és a közönség internetének lehetőségeit. Nem mindenkinek van száloptikája. Tehát nem ajánlott 2 Mbps fölé állítani a bitrátát.

A második dolog, amire figyelni kell, az úgynevezett bit/pixel arány. Ez a képlet egyszerű:

bit/(pixel*kocka)

Mit csinál adott képlet? Tegyük fel, hogy kódolunk egy adatfolyamot 100px x 100px felbontással, 25 fps-sel (képkocka/másodperc), és a bitrátát 250 kbps-ra (kilobit/s) állítjuk be. Tehát egy 10 000 pixel (százszor száz) méretű videó másodpercére 25 képkocka és 250 kilobit van lefoglalva. Képkockánként 10 kilobit (10000 bit) jön ki (250/25). A képkockánként lefoglalt biteket elosztjuk a pixelben megadott mérettel - megkapjuk a bit/pixel arányt -, hogy mennyi információ jut egy pixel "kódolásához".

Minél több információ van kiemelve, annál jobb a minőség.

Példánkban a bit/pixel aránya: (10 000 bit per képkocka) / (10 000 pixel) = 1. Túl sok lesz. Egészen kiváló minőséget lehet kapni tisztelettel 0,1 -0,15 . Példánkban a ~ 32-35 kbps bitsebesség elegendő lenne.

Számítsuk ki a hozzávetőleges bit/pixel arányokat a leggyakoribb felbontásokhoz:

720p: 1280×720 pont:

  • Bitráta 1500 kbps – 1500000/((1280*720)*25) = 1500000/23040000 = 0,065
  • Bitráta 2500 kbps – 2500000/((1280*720)*25) = 2500000/23040000 = 0,109
  • Bitráta 3500 kbps – 3500000/((1280*720)*25) = 3500000/23040000 = 0,152

1080p: 1920×1080 pont:

  • Bitráta 1500 kbps – 1500000/((1920*1080)*25) = 1500000/51840000= 0,029 ( amint láthatja, a minőség ugyanazon a bitsebességen körülbelül 2,5-szer rosszabb lesz, tehát 1080p-hez nagyobb bitsebességre van szükség, mint 720p-hez)
  • Bitráta 5000 kbps – 5000000/((1920*1080)*25) = 5000000/23040000 = 0,096
  • Bitráta 7500 kbps – 7500000/((1920*1080)*25) = 7500000/23040000 = 0,145
  • Bitráta 10000 kbps – 10000000/((1920*1080)*25) = 10000000/23040000 = 0,192

Milyen következtetéseket lehet levonni? Először is, és ami a legfontosabb: ha nem tudja biztosítani a felbontást a szükséges bitrátával, ne próbálja meg az adatfolyamot. Még mindig streamelni szeretne? Csökkentse a felbontást vagy az fps-t. Fejezd be a bit/pixel értéket legalább 0,075-0,1-ig, vagy jobb esetben többre.

Minőség

Engedély

Videó bitráta,kbps

Audio bitráta,kbps

FPS fps

Videokodek

h.264profil

Audiokodek

Audio csatorna

240 p(426x240)

400 (300-700)

AAC vagy MP3

270p(480x270)

400 (300-700)

AAC vagy MP3

360p(640x360)

750 (400-1000)

AAC vagy MP3

480p(854x480)

1000 (500-2000)

AAC vagy MP3

540p(960x540)

1000 (800 - 2000)

AAC vagy MP3

Mono ill
Sztereó

720p(1280x720)

2500 (1560-4000)

AAC vagy MP3

Mono ill
Sztereó

720p(1280x720)

3800 (2500-6000)

AAC vagy MP3

Mono ill
Sztereó

1080p(1920x1080)

4500 (3000-6000)

AAC vagy MP3

Mono ill
Sztereó

1080p(1920x1080)

6800 (4500-9000)

AAC vagy MP3

Mono ill
Sztereó

1440p)(2560x1440)

9000 (6000-13000)

AAC vagy MP3

Mono ill
Sztereó

1440p(2560x1440)

13000 (9000-18000)

AAC vagy MP3

Mono ill
Sztereó

4K/2160r(3840x2106)

23000 (13000-34000)

AAC vagy MP3

Mono ill
Sztereó

4K/2160r(3840x2106)

35000 (20000-51000)

AAC vagy MP3

Mono ill
Sztereó



Kezdőlap / Útmutató / Bitráta kiválasztása streaminghez

jegyzet: az alábbi szöveg jobb megértése érdekében erősen ajánlom, hogy ismerkedjen meg az alapokkal digitális hang.

    S: Minél nagyobb a bitráta, annál jobb a sáv

    R: Ez nem mindig van így. Először is hadd emlékeztesselek, mi az a bitrey T(bitráta, nem bitraid). Valójában ez az adatátviteli sebesség kilobit/másodpercben a lejátszás során. Vagyis ha vesszük a pálya méretét kilobitben, és elosztjuk a másodpercekben megadott időtartamával, akkor megkapjuk a bitrátáját - az ún. fájl alapú bitráta (FBR), általában nem különbözik túlságosan az audio stream bitrátájától (a különbségek oka a metaadatok jelenléte a sávban - címkék, beágyazott képek stb.).

    Most vegyünk egy példát: a normál Audio CD-re rögzített tömörítetlen PCM-audio bitrátája a következőképpen számítható ki: 2 (csatorna) * 16 (bit per minta) * 44100 (minta per másodperc) = 1411200 (bps) = 1411,2 kbps. És most vegyük és tömörítsük a sávot bármilyen veszteségmentes kodekkel ("lossless" - "lossless", azaz olyannal, amely nem vezet adatvesztéshez), például a FLAC kodekkel. Ennek eredményeként az eredetinél alacsonyabb bitrátát kapunk, de a minőség változatlan marad - itt az első cáfolat.

    Van itt még valami, amit érdemes hozzátenni. A veszteségmentes tömörítésű kimeneti bitsebesség nagyon eltérő lehet (de általában kisebb, mint a tömörítetlen hangé) - ez a tömörített jel összetettségétől, vagy inkább az adatredundanciától függ. Így az egyszerűbb jelek jobban tömörülnek (azaz van kisebb méret azonos időtartamú fájl => alacsonyabb bitráta), a bonyolultabbak pedig rosszabbak. Ezért van az, hogy a veszteségmentes klasszikus zene alacsonyabb bitrátájú, mint mondjuk a rocké. De hangsúlyozni kell, hogy a bitráta itt semmiképpen sem a hanganyag minőségének mutatója.

    Most beszéljünk a veszteséges tömörítésről (veszteséges). Először is meg kell értenie, hogy sok különböző kódoló és formátum létezik, és még ugyanazon a formátumon belül is eltérő lehet a kódolás minősége a különböző kódolókhoz (például a QuickTime AAC sokkal jobban kódol, mint az elavult FAAC), nem említsd meg a modern formátumok (OGG Vorbis, AAC, Opus) felsőbbrendűségét az MP3-mal szemben. Egyszerűen fogalmazva, a két azonos sáv közül, amelyeket különböző kódolók kódolnak azonos bitsebességgel, egyesek jobban szólnak, mások pedig rosszabbul.

    Ezen kívül van olyan, hogy pl felkonvertálni. Vagyis 96 kbps bitsűrűségű MP3 formátumú műsorszámot készíthet és konvertálhat MP3 320 kbps sebességűvé. Nemhogy a minőség nem fog javulni (elvégre az előző, 96 kbps-os kódolás során elveszett adatot nem lehet visszaadni), sőt még romlani is fog. Itt érdemes kiemelni, hogy a veszteséges kódolás minden szakaszában (bármilyen bitrátával és bármilyen kódolóval) a torzítás egy bizonyos része bekerül a hangba.

    És még több. Van még egy árnyalat. Ha mondjuk egy audio adatfolyam bitsebessége 320 kb/s, az nem jelenti azt, hogy mind a 320 kb/s-t éppen abban a másodpercben a kódolásra költötték. Ez jellemző az állandó bitsebességű kódolásra, és azokra az esetekre, amikor az ember a maximális minőség elérésében túl magasra kényszeríti az állandó bitsebességet (például 512 kbps CBR beállítása a Nero AAC-hoz). Mint tudják, az adott kerethez allokált bitek számát a pszichoakusztikus modell szabályozza. De abban az esetben, ha a kiosztott mennyiség jóval alacsonyabb, mint a beállított bitsebesség, még a bittároló sem takarít meg (a feltételekről olvassa el a „Mi a CBR, ABR, VBR?” cikkben) - ennek eredményeként használhatatlanná válunk. „nulla bitek”, amelyek egyszerűen „befejezik” a keretméretet a kívánt méretre (azaz növelik a stream méretét a megadott méretre). Egyébként ez könnyen ellenőrizhető - tömörítse a kapott fájlt egy archiválóval (lehetőleg 7z), és nézze meg a tömörítési arányt - minél magasabb - minél több nulla bit (mert redundanciához vezet), annál több helyet veszítenek.


    S: A DVD-Audio jobban szól, mint az Audio CD (24 bit vs 16, 96 kHz vs 44.1 stb.)

    R: ez elvileg teljesen logikus, sőt részben igaz is, de az emberek általában csak a számokat nézik, és nagyon ritkán gondolnak egy-egy paraméter befolyására.

    Tehát kezdjük a bitmélységgel. Ez a beállítás nem tesz mást, mint dinamikus hatókör, azaz a leghalkabb és leghangosabb hangok közötti különbségért (dB-ben). A digitális hangzásban a maximális szint 0 dBFS, a minimális szintet pedig a zajszint korlátozza, vagyis valójában a modulo dinamikatartomány megegyezik a zajszinttel. 16 bites hang esetén a dinamikatartomány kiszámítása 20*log(2^16) ? 96,33 (dB). Ugyanakkor egy szimfonikus zenekar dinamikatartománya eléri a 75 dB-t (leginkább 40-50 dB).

    Most képzeljük el a valós körülményeket. A helyiség zajszintje körülbelül 40 dB (ne felejtsük el, hogy a dB relatív érték. Ebben az esetben a hallásküszöböt 0 dB-nek vesszük), a maximális zenei hangerő eléri a 110 dB-t (hogy ne legyen kellemetlenség) - 70 dB különbséget kapunk. Így kiderül, hogy a 70 dB-nél nagyobb dinamikatartomány ebben az esetben egyszerűen haszontalan. Vagyis magasabb tartományban vagy a hangos hangok érik el a fájdalomküszöböt, vagy csendes hangok elnyeli a környezeti zaj. Nagyon nehéz elérni 15 dB-nél kisebb környezeti zajszintet (mivel ezen a szinten hangos emberi leheletés egyéb emberi tényező okozta zajok), ennek eredményeként a 95 dB-es tartomány teljesen elegendő zenehallgatáshoz.

    Most a mintavételezési frekvenciáról (mintavételezési frekvencia, mintavételi frekvencia). Ez a paraméter felelős az időszeletelési frekvenciáért, és közvetlenül befolyásolja az ezzel az audio-reprezentációval leírható maximális jelfrekvenciát. A Kotelnyikov-tétel szerint egyenlő a mintavételi frekvencia felével. Azaz egy tipikus 44100 Hz-es mintavételezési frekvencia esetén a jelösszetevők maximális frekvenciája 22050 Hz. A maximális frekvencia. amelyet az emberi fül érzékel - valamivel 20 000 Hz felett (majd születéskor; ahogy öregszik, a küszöb 16 000 Hz-re csökken).

    Olvassa el a 24/192 Letöltéseket – miért nincs értelme.


    S: A különböző szoftveres lejátszók eltérő hangzásúak (például a foobar2000 jobb, mint a Winamp, stb.)

    R: Ahhoz, hogy megértsük, miért nem ez a helyzet, meg kell értened, mi az a szoftverlejátszó. Valójában ez egy dekóder, kezelők (opcionális), kimeneti bővítmény (az egyik interfészhez: ASIO, DirectSound, WASAPI stb.), és természetesen a GUI (felhasználó). Mivel a dekóder az esetek 99,9%-ában a szabványos algoritmus szerint működik, a kimeneti plugin pedig csak egy része annak a programnak, amely valamelyik interfészen keresztül küldi a streamet a hangkártyára, ezért az eltérések okai csak a kezelők lehetnek. De tény, hogy a kezelők alapból általában le vannak tiltva (vagy ki kell kapcsolni, hiszen egy jó lejátszónak az a lényege, hogy a hangot „eredeti” formában tudja továbbítani). Ebből kifolyólag itt az összehasonlítás tárgya csak az lehet lehetőségeket feldolgozás és kimenet, amelyekre egyébként gyakran egyáltalán nincs szükség. De még ha van is ilyen igény, akkor ez már a kezelők összehasonlítása, és nem a játékosok.

    Itt szeretném megemlíteni a saját és talán ideges felhasználókat is, akik csodálják a hangzás „kolosszális” változásait a benne leírt beállítás után - az esetek 95%-ában önhipnózisról van szó (kivéve persze, ha néhány „ fokozó" vagy más kezelő, amely elrontja az összképet). Sajnos a ReplayGain, a resamplerek és a limiterek trükkjei csekélyek. Következtetés: nagyon szeretném minőségi hangzás- vedd meg magad Hi-Fi akusztikaés egy professzionális hangkártya.


    S: A különböző illesztőprogram-verziók eltérő hangzásúak

    R: Ez az állítás a hangkártya alapelveinek banális tudatlanságán alapul. Az illesztőprogram olyan szoftver, amely szükséges ahhoz, hogy az eszköz hatékonyan kommunikálhasson az operációs rendszerrel, és általában grafikus felhasználói felületet biztosít az eszköz, annak paramétereinek stb. vezérléséhez. A hangkártya illesztőprogramja biztosítja a hangkártya felismerését. hangkártyaként tájékoztatja az operációs rendszert a kártya által támogatott formátumokról, tömörítetlen PCM adatfolyamot (általában) biztosít a kártyához, és hozzáférést biztosít a beállításokhoz. Ezenkívül szoftveres feldolgozás esetén (a CPU segítségével) az illesztőprogram különféle DSP-ket (kezelőket) tartalmazhat. Ezért először is, ha az effektusok és a feldolgozás le van tiltva, ha az illesztőprogram nem biztosít pontos PCM-átvitelt a kártyára, ez súlyos hibának, kritikus hibának minősül. És megtörténik ritkán. Másrészt az illesztőprogramok közötti különbségek a feldolgozási algoritmusok (resamplerek, effektek) frissítésében lehetnek, bár ez is nagyon ritkán fordul elő. Ezenkívül az effektusokat és az illesztőprogram által végzett bármilyen feldolgozást továbbra is le kell tiltani / megkerülni a legmagasabb minőség elérése érdekében.

    Így az illesztőprogram-frissítések főként a stabilitás javítására és a feldolgozási hibák kiküszöbölésére összpontosítanak. Sem egyik, sem a másik esetünkben nem befolyásolja a lejátszás minőségét, ezért 1000-ből 999 esetben a meghajtó nem befolyásolja a hangot.


    S: A licencelt audio CD-k jobban szólnak, mint a másolatok

    R: Ha nem történik (végzetes) olvasási/írási hiba a másolás során és Optikai meghajtó készülék, amelyen a másolólemezt lejátssza, nincs probléma az olvasással, akkor egy ilyen állítás hibás és könnyen megcáfolható.


    S: A sztereó kódolási mód jobb minőséget biztosít, mint a Joint Stereo

    R: Ez a tévhit elsősorban a LAME MP3-ra vonatkozik, mivel minden modern kódoló (AAC, Vorbis, Musepack) csak Közös sztereó mód (és ez mond valamit)

    Először is érdemes megemlíteni, hogy a Joint Stereo módot sikeresen használják veszteségmentes tömörítéssel. Lényege abban rejlik, hogy a kódolás előtti jelet a jobb és bal csatorna összegére (Mid) és azok különbségére (Side) bontják, majd ezeket a jeleket külön kódolják. A limitben (a jobb és a bal csatornán ugyanazon információk esetén) dupla adatmentés érhető el. És mivel a legtöbb zenében a jobb és a bal csatornák információi meglehetősen hasonlóak, ez a módszer nagyon hatékony, és lehetővé teszi a tömörítési arány jelentős növelését.

    Losyban az elv ugyanaz. De itt, az állandó bitsebességű módban, a két csatornán hasonló információval rendelkező töredékek minősége nő (a határértékben - kétszeres), és a VBR módban ilyen helyeken a bitsebesség egyszerűen csökken (ne felejtsük el, hogy a fő feladat A VBR mód célja a megadott kódolási minőség stabil fenntartása a lehető legalacsonyabb bitráta használatával). Mivel a veszteséges kódolás során a sztereó romlás elkerülése érdekében a csatornák összege kap prioritást (bitallokációban), dinamikus váltás a Joint Stereo (Mid/Side) és a normál (bal/jobb) képkocka alapú sztereó között. Ennek a tévhitnek az oka egyébként a LAME régebbi verzióiban a kapcsolási algoritmus tökéletlensége, valamint a Forced Joint mód jelenléte volt, amelyben nincs automatikus váltás. A LAME legújabb verzióiban a Joint mód alapértelmezés szerint engedélyezve van, és nem ajánlott megváltoztatni.


    S: Minél szélesebb a spektrum, annál jobb a felvétel (a spektrogramokról, az auCDtectről és a frekvenciatartományról)

    R: Sajnálatos, hogy manapság a fórumokon nagyon elterjedt, hogy "spektrogram szerint vonalzóval" mérik a pálya minőségét. Nyilvánvalóan ennek a módszernek az egyszerűsége miatt. De amint azt a gyakorlat mutatja, a valóságban minden sokkal bonyolultabb.

    És itt van a dolog. A spektrogram vizuálisan bemutatja a jelteljesítmény eloszlását a frekvenciákon, de nem tud teljes képet adni a felvétel hangjáról, a benne lévő torzítások és tömörítési műtermékek jelenlétéről. Vagyis valójában minden, ami a spektrogramból meghatározható, a frekvenciatartomány (és részben - a spektrum sűrűsége a HF régióban). Vagyis a legjobb esetben a spektrogram elemzésével felkonvertálás észlelhető. A különböző kódolókkal való kódolással kapott sávok spektrogramjainak összehasonlítása az eredetivel puszta abszurdum. Igen, észlelhető különbségek a spektrumban, de annak meghatározása, hogy az emberi fül érzékeli-e (és milyen mértékben), szinte lehetetlen. Nem szabad megfeledkeznünk arról, hogy a veszteséges kódolás feladata, hogy az eredmény megkülönböztethetetlen legyen emberi fül az eredetiből (nem szemmel).

    Ugyanez vonatkozik a kódolás minőségének értékelésére a kimeneti sávok auCDtect segítségével történő elemzésével (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect csak az egyedülálló auCDtect konzolprogram burkolói). Az auCDtect algoritmus a frekvenciatartományt is elemzi, és csak annak meghatározását teszi lehetővé (bizonyos valószínűséggel), hogy alkalmaztak-e MPEG-tömörítést valamelyik kódolási szakaszban. Az algoritmus MP3-ra van szabva, így könnyen "átverhető" Vorbis, AAC és Musepack kodekek segítségével, így hiába írja ki a program "100% CDDA" - ez nem jelenti azt, hogy a kódolt hang 100%-ban konzisztens az eredetivel.

    És visszatérve közvetlenül a spektrumokhoz. Szintén népszerű az a vágy, hogy egyes "rajongók" mindenképpen kapcsolják ki az aluláteresztő (LF) szűrőt a LAME kódolóban. Itt a kódolás és a pszichoakusztika elveinek félreértése van. Először is, a kódoló levágja a magas frekvenciákat abból a célból, hogy elmentse az adatokat, és a leginkább hallható frekvenciatartományt kódolja. A kiterjesztett frekvenciatartomány végzetes lehet az általános hangminőségre nézve, és hallható kódolási műtermékekhez vezethet. Ezenkívül a 20 kHz-es levágás kikapcsolása teljesen indokolatlan, mivel az ember egyszerűen nem hallja a magasabb frekvenciákat.


    S: Van egyfajta „varázslatos” hangszínszabályzó, amely jelentősen javíthatja a hangzást

    R: Ez nem teljesen igaz, egyrészt azért, mert minden egyes konfiguráció (fejhallgató, akusztika, hangkártya) saját paraméterei vannak (különösen az amplitúdó-frekvencia karakterisztikája). Ezért minden konfigurációnak saját, egyedi megközelítéssel kell rendelkeznie. Egyszerűen fogalmazva, létezik ilyen előre beállított hangszínszabályzó, de ez különbözik a különböző konfigurációkban. Lényege a traktus frekvenciaválaszának beállításában rejlik, nevezetesen a nem kívánt süllyedések és kitörések "igazításában".

    Ezenkívül a hanggal való közvetlen munkától távol álló emberek körében nagyon népszerű a grafikus hangszínszabályzó „pipával” történő beállítása, ami valójában a basszus és a magas komponensek szintjének növekedését jelenti, ugyanakkor tompa énekhanghoz és hangszerekhez vezet, amelynek hangspektruma a középtartományban helyezkedik el .


    S: Mielőtt a zenét más formátumba konvertálná, "kicsomagolja" WAV-ba

    R: Mindjárt megjegyzem, hogy a WAV PCM adatot jelent (impulzuskód moduláció) WAVE konténerben (*.wav kiterjesztésű fájl). Ez az adat nem más, mint bitek sorozata (nullák és egyesek) 16, 24 vagy 32-es csoportokban (a bitmélységtől függően), amelyek mindegyike a megfelelő minta amplitúdójának bináris kódja (pl. 16 bit decimális ábrázolásban, ezek -32768 és +32768 közötti értékek).

    Tehát a tény az, hogy minden hangprocesszor - legyen az szűrő vagy kódoló - általában működik csak ezekkel az értékekkel, vagyis csak tömörítetlen adatokkal. Ez azt jelenti, hogy egyszerűen konvertálhatja a hangot mondjuk FLAC-ból APE-be szükséges először dekódolja a FLAC-ot PCM-re, majd kódolja a PCM-et APE-be. Ez olyan, mint a fájlok átcsomagolása ZIP-ből RAR-ba, először ki kell csomagolnia a ZIP-t.

    Ha azonban konvertert vagy csak fejlett konzolkódolót használ, a köztes átalakítás PCM-re menet közben történik, néha anélkül, hogy ideiglenes WAV-fájlba írna. Ez az, ami félrevezeti az embereket - úgy tűnik, hogy a formátumokat közvetlenül egymásba konvertálják, de valójában egy ilyen programnak szükségszerűen van bemeneti formátumú dekódere, amely közbenső konverziót hajt végre PCM-re.

    Így a WAV-ra való manuális konvertálás semmi mást nem jelent, csak időpocsékolást.


A bitrátát szokás használni egy adatfolyam effektív átviteli sebességének egy csatornán keresztüli mérése során, vagyis a csatorna minimális méretét, amely késedelem nélkül képes átadni ezt az adatfolyamot.

A bitsebességet bit/másodpercben fejezzük ki (bps, bps), valamint származékos mennyiségek kilo- előtagokkal (kbps, kbps), mega- (Mbps, Mbps) stb.

Adatsebesség bit per blokkmásodperc használatával (szimbólum: "bps"), gyakran a Nemzetközi Mértékegységrendszer (SI) előtagjaival együtt használatos, például "kilo" (1 kbps = 1024 bps), "mega" (1 Mbps = 1024 kbps) ), "giga" (1 Gbps = 1024 Mbps) vagy "tera" (1 Tbps = 1024 Gbps). A nem szabványos "bps" rövidítést gyakran használják a "bps" szabványos karakter helyettesítésére, így például az "1 Mbps" egymillió bitet jelent másodpercenként. Egy bájt másodpercenként (1 B/s) 8 bit/s-nak felel meg.

Enciklopédiai YouTube

  • 1 / 5

    A veszteséges tömörítést használó streaming video- és audioformátumokban (például MPEG és MP3) a „bitráta” paraméter az adatfolyam-tömörítés mértékét fejezi ki, és ezáltal meghatározza annak a csatornának a méretét, amelyre az adatfolyamot tömörítik. Leggyakrabban a hang és a videó bitsebességét kilobit per másodpercben mérik (angol kilobit per másodperc, kbps), ritkábban - megabit per másodpercben (csak videó esetén).

    Három adatfolyam-tömörítési mód létezik:

    • CBR(eng. Constant bitrate) - állandó bitrátával;
    • VBR(eng. Variable bitrate) - változó bitrátával;
    • ABR(eng. Average bitrate) - átlagos bitrátával.

    Információátviteli sebesség

    A digitális kommunikációs csatorna fizikai rétegének nettó bitsebessége, információsebessége, hasznos bitsebessége, hasznos adatátviteli frekvenciája, nettó adatsebessége, kódolt átviteli sebessége, effektív adatsebessége vagy vezetéksebessége (nem hivatalos nyelv) az a képesség, amely nem veszi figyelembe réteg overhead protokoll, multiplexekhez, egy példa az időosztásos (TDM) keretezési bitekre, a fenntartott előremenő hibajavító (FEC) kódokra, a betanítási szimbólum-ekvalizerre és más csatornakódolásra. A menekülési kódok gyakoriak, különösen a rendszerekben vezeték nélküli kommunikáció, szélessávú modem szabványok vagy modern nagy sebességű helyi hálózatok réz alapú. A fizikai réteg nettó bitsebessége a kapcsolati réteg és a fizikai réteg közötti interfész referenciapontján mért adatsebesség, ezért magában foglalhatja az adatkapcsolatot és a terhelési réteget is.

    A modemekben és a vezeték nélküli rendszerekben gyakran alkalmazzák a kapcsolat-adaptációt (az adatsebesség és a modulációs és/vagy kódolási hibák, jelminőség automatikus adaptálása). Ebben az összefüggésben a csúcsbitráta kifejezés a leggyorsabb és legkevésbé megbízható átviteli mód nettó bitsebességét jelenti, amelyet például [ha a távolság nagyon kicsi] a küldő és az adó között használnak. Egyes operációs rendszerek és hálózati berendezések képesek észlelni egy adott hálózati hozzáférési technológia vagy kommunikációs eszköz „kapcsolati sebességét” (nem hivatalos nyelv), amely az aktuális nettó adatsebességet feltételezi. Meg kell jegyezni, hogy egyes tankönyvekben a vonalsebesség kifejezés a bruttó bitsebességet, másokban pedig a nettó adatsebességet jelenti.

    A kumulatív bitsebesség és a nettó adatsebesség közötti kapcsolat az FEC kódsebességtől függ a következők szerint.

    Állandó bitráta

    Állandó bitráta- a streaming adatok kódolásának egy változata, amelyben a felhasználó először beállítja a szükséges bitsebességet, amely nem változik a teljes fájlban.

    Fő előnye, hogy meglehetősen pontosan megjósolhatja a végső fájl méretét.

    Az állandó bitráta opció azonban nem nagyon alkalmas olyan zenei kompozíciókhoz, amelyek hangzása idővel dinamikusan változik, mivel nem biztosít optimális méret/minőség arányt.

    Változó bitráta

    VAL VEL változó bitráta a kodek a paraméterek (kívánt minőségi szint) alapján választja ki a bitráta értéket, és a bitráta változhat a kódolt töredék alatt. A hang tömörítésekor a kívánt bitráta meghatározása a pszichoakusztikus modell alapján történik. Ez a módszer adja a legjobb minőség/méret arányt a kimeneti fájlhoz, de a pontos mérete nagyon rosszul megjósolható. A hang (vagy videó kódolás esetén a kép) jellegétől függően az eredményül kapott fájl mérete többszörösen eltérhet.

    Átlagos bitsebesség

    Átlagos bitsebesség konstans és változó bitsebesség hibridje: a kbps értéket a felhasználó állítja be, és a program bizonyos határok között változtatja. A VBR-től eltérően azonban a kodek körültekintően használja a lehetséges maximális és minimális értékeket, anélkül, hogy megkockáztatná, hogy túllépjen a felhasználó által megadott átlagértéken. Ez a módszer teszi lehetővé a legnagyobb rugalmasságot a feldolgozási sebesség beállításában (hang esetén ez tetszőleges szám lehet 8 és 320 kbps között, szemben a 16 többszörösével a CBR-módszerben), és sokkal nagyobb pontossággal (a VBR-hez képest) a feldolgozási sebesség előrejelzésében. a kimeneti fájlt.

    MP3

    MP3 veszteséges hangtömörítési formátum. A hangminőség a bitráta növekedésével javul:

    • 32 kbps - általában csak beszéd esetén elfogadható
    • 96 kbps – jellemzően gyenge minőségű beszéd- vagy hangfolyam-továbbításhoz használatos
    • 128 vagy 160 kbps – belépő szintű zenei kódolás
    • 192 kbps – elfogadható zenei kódolási minőség
    • 256 kbps – kiváló minőségű zenei kódolás
    • 320 kbps - legmagasabb minőség az MP3 szabvány által támogatott kódolás

    A bitráta a video- és hangfelvételek egyik fő jellemzője. A legtöbb felhasználó hozzászokott ahhoz, hogy ez határozza meg a letöltött fájl minőségét. De mik azok a bitrátok, és hogyan jellemzik valójában a zenei fájlokat és videókat? Tekintsük ezt részletesebben.

    Mik azok a bitráták?

    A bitráta egy olyan érték, amely a fájllejátszás egy másodpercében található információegységek számát (megabit vagy kilobit) mutatja. Ennek megfelelően megabit per másodpercben (Mbps) vagy kilobit per másodpercben (Kbps) mérik. Egyébként a bitráta sávszélességként írható le. Ez a jellemző azok számára fontos, akik fájlokat szeretnének konvertálni, mert azonos időtartam mellett nagyobb bitráta nagyobb fájlt eredményez. A méret mellett a hangminőség is változik. A méretcsökkenést a bitsebesség csökkenésével tömörítésnek nevezzük.

    A közönséges zenei fájl olyan hangfájl, amelyet olyan mértékben tömörítenek, hogy akár 12 órányi zene is elférjen egy szabványos lemezen. Ugyanakkor a pszichoakusztikus tömörítés miatt a minőség továbbra is meglehetősen magas: az emberi fül által nem érzékelhető frekvenciájú és hangerős hangok a teljes tartományból kikerülnek. A kiválasztott hangok különálló blokkokká, úgynevezett keretekké alakulnak. A képkockák hanghossza azonos, és egy adott algoritmus szerint tömörítik őket. Zene lejátszásakor a jel a dekódolt blokkokból meghatározott sorrendben jön létre.

    Mi az általánosan használt tömörítés?

    Az audio bitráta leggyakrabban 256 Kbps. Ez a beállítás körülbelül hatszorosára tömöríti a hangfelvételt, így akár 6-szor több zene rögzíthető egy lemezre, mint a tömörítés előtt. Ha a bitrátát 128 Kbps-ra csökkentjük, akkor 12-szer több zene fér egy lemezre, de a hangminőség érezhetően gyengébb lesz. A 128 Kbps sebességgel rögzített zenét leggyakrabban az interneten kínálják meghallgatásra, mivel az erőforrás-tulajdonosok minden áldozatot meghoznak az oldalbetöltési sebesség növelése érdekében. Sok felhasználó megjegyzi, hogy minősége messze nem ideális.

    Most, hogy világossá vált, hogy mik a bitráták, ideje meghatározni azok optimális szintjét. Az amatőrök és a profik is végtelenül vitatkoznak arról, hogy a bitráta hogyan befolyásolja a hangminőséget, és egyáltalán befolyásolja-e. A zenei albumokon általában a bitrátát jelzik. Ugyanaz a lemez, amelyet 128 Kbps és 256 Kbps sebességgel rögzítettek, kétszer különbözik az árban.

    Optimális bitráta különböző hallgatási körülmények között

    Sokak számára a tizenkétszeres tömörítés nem jelent kárt, míg mások azt állítják, hogy nem hallgathatnak 320 Kbps-nál kisebb bitsebességű zenét. Paradox módon mindkettőnek igaza van. A helyzet az, hogy a reprodukció minősége végül nem a reprodukálás körülményeitől, hanem a zene típusától függ.

    Például egy dalt egy háztartási autóba szerelt magnón játszanak le. Ebben az esetben a 192 Kbps-os minőség elég lesz. A nagyobb bitsebesség javítja a hangminőséget, de a különbség nem lesz észrevehető az utazás során tapasztalható magas zajszint miatt. Ha szól a zene otthoni számítógép vagy hordozható lejátszó, legalább 256 Kbps szükséges. Ha a jel nem változik, külső eszközökre kerül, és drága importált hangszórókra kerül, akkor lehetőség szerint minimális tömörítést kell alkalmazni. 320 Kbps bitsebességgel lehetséges.

    Optimális bitráta különféle zenei stílusokhoz

    Nem mindig van szükség nagy bitrátájú zenére. A népszerű zene általában elég jól szól 192-256 kbps sebességgel. Magasabb minőséget is be lehet állítani, de ennek semmi értelme: a popdalok rövid életűek, ezért a lemezterület megtakarítása prioritás legyen. Ráadásul az eredeti felvételek minősége is közepes, így a bitráta növelése semmilyen módon nem befolyásolhatja a lejátszott fájl minőségét. A közlekedésben és a nem hivatalos bulikon való hallgatáshoz az átlagos minőség is elég.

    Ha beszélgetünk O klasszikus zene, legendás rockzenekarok művei vagy ritka szerzői dalok, akkor a minőség legyen mindenekelőtt. Ilyen zene vásárlásakor meg kell nézni a lemez csomagolásán feltüntetett bitrátát. Ha a dalt az internetről töltik le, akkor ennek az információnak jelen kell lennie a letöltési oldalon. Ezenkívül lejátszás közben a lejátszóban megjelenik a bitsebesség.

    A videofájlok bitsebessége

    Fentebb beszéltünk arról, hogy mik a hangfelvételek bitrátája. De mi az a videó bitráta? Figyelembe véve, hogy a videót hangok és képek sorozataként játsszák le, a bitsebesség meghatározása hasonló lesz. A videoszekvencia jelenléte megnehezíti a fájlt, de végül a processzor képei ugyanazok a nullák és egyesek, mint a hangok. Az információtitkosítás elve minden fájltípusnál ugyanaz.