piątek, 9 października 2015

CDA vs. DVDA i SACD czyli Audibility of a CD-Standard A/DA/A Loop Inserted into High-Resolution Audio Playback

Słyszalność pętli A/D/A w standardzie CD wstawionej w tor
odtwarzania dźwięku o wysokiej rozdzielczości*

E. BRAD MEYER, AES i David R. MORAN, AES
(EbradMeyer @ att.net) (drmoran @ aol.com)
Boston Audio Society, Lincoln, MA 01773, USA

Regularnie publikuje się lub kolportuje w formie anegdot opinie o wyższej jakości dźwięku
dwukanałowego zakodowanego z użyciem dłuższych słów bitowych i/lub w wyższych częstotliwości próbkowania niż Standard CD 16-bit/44,1 kHz. Autorzy przedstawiają sprawozdanie z serii badań z podwójnie ślepym testem porównawczym nagrań odtwarzanych w wysokiej rozdzielczości z wyjścia analogowego odtwarzacza wysokiej rozdzielczości z tym samym sygnałem przechodzącym przez „szyjkę od butelki” 16-bit/44,1 kHz. Badania prowadzano przez ponad rok, z wykorzystaniem różnych systemów i różnych grup słuchaczy. Systemy składały się z drogich profesjonalnych głośników, a jeden system high-end miał głośniki elektrostatyczne i drogie
komponenty i kable. Grupa słuchaczy obejmuje profesjonalnych inżynierów nagraniowych, studentów uniwersytetu z programem rejestracji dźwięku i zagorzałych audiofilów. Wyniki badań wskazują, że obecność pętli A/D/A w jakości CD była niewykrywalna przy normalnych do głośnych poziomach dźwięku, przez któregokolwiek ze słuchaczy na żadnym z systemów odtwarzania. Szum pętli jakości CD słychać było tylko przy bardzo podwyższonym poziomie głośności.


0) KULISY

Od momentu przyjęcia standardu formatu CD PCM 16-bitów/44,1 kHz ponad 25 lat temu, jego jakość jako nośnika zapisu był obiektem regularnej krytyki, zarówno w subiektywnej prasie audio jak i wśród profesjonalistów. Zazwyczaj koncentrowano się na szorstkości, braku głębi lub na zimnym, sterylnym dźwięku. Jednak ślepe testy porównawcze płyt z ich taśmami matkami wykazały, że te poglądy są nieuprawnione. W tym zakresie standard CD był przejrzysty, bez względu na to czy pierwotne źródło było cyfrowe, czy analogowe.

Tymczasem techniki cyfrowe ewoluowały, a w kilku ostatnich latach pojawiły się dwie nowe technologie dźwięku o wysokiej rozdzielczości, Super Audio CD (SACD) i DVD-Audio jako alternatywy.

Przydatność zwiększonego zakresu dynamiki gwarantowanego przez większą długość słowa dla miksowania nigdy nie była poddawana w wątpliwość. Oba nowe systemy umożliwiały również zapis wielokanałowy będący istotną potencjalną zaletą odtwarzania. Ale pomijając te uznawane możliwości, każdy z tych formatów okrzyknięto jako oferujący brzmienie o wyższej jakości. Jak zapewniał licencjodawca w tym dokumencie[1]:

Długotrwała krytyka audiofilska płyt CD polega na tym
że brakuje im rozdzielczości, aby reprodukować wszystkie szczegóły w materiale
muzycznym. ... Obecna wysoka jakości dźwięku ukazuje, że
CD to "wąskie gardło" ... Audio w wysokiej rozdzielczości
gwarantuje lepszy dźwięk niż płyty CD, a jego potencjał
wykazano już dla nośników, które odtwarzając przenoszą szersze
pasmo ... i większy zakres dynamiczny ... Dowody doświadczalne
i amatorskie obserwacje wskazują, że wyższe
próbkowanie "brzmi lepiej." Zazwyczaj obserwuje się, że przy
wyższej częstotliwości próbkowania dźwięk jest klarowniejszy,
gładszy, ma lepszą definicję niskich częstotliwości i jest bardziej "naturalny".
Z doświadczenia autora wynika,
że wyższe próbkowanie może prowadzić do lepszego rozróżniania
pierwszego i dalszego planu. "Obiekty" są lepiej
oddzielone od akustycznego tła i
są bardziej przejrzyste i "kompletne".

Osoby prywatne i czasopisma o tematyce inżynierii dźwięku deklarowały wielokrotnie, że oba formaty oferują całkowicie oczywistą poprawę w stosunku do standardu CD.

Takie twierdzenia wykazują brak świadomości istnienia wcześniejszych prac badawczych [2] [3] [4], i wszystkie nowsze teksty bazują na jednym tylko parametrze: możliwości, że nagrania w wysokiej rozdzielczości oferuje poprawę brzmienia przez potencjalne rozszerzenie zakresu rejestrowania wysokich częstotliwości niezależnie od tego, że wszyscy uznawali u zarania ery CD, że jakość jest wystarczająca, [2] a nawet uważa się, że szerokość pasma może być większa niż to konieczne.

1 TESTY
Pomimo roszczeń co do SACD i DVD-A, o ile autorom to jest wiadome, nie wykonano prawidłowo kontrolowanych ślepych testów wykazujących wyższość jakości dźwięku w porównaniu do CD; przynajmniej takie badania nie zostały opublikowane. W momencie wydania tekstu przewodniego J. R. Stuarta “Coding for High-Resolution Audio Systems,” przez J. Audio Eng. Soc.[1], stało się jasne, że czas najwyższy rozstrzygnąć sprawy naukowo. Ta praca opisuje podwójnie ślepe testy porównawcze odtwarzania dźwięku stereo w wysokiej rozdzielczości i tego samego sygnału przepuszczonego przez pętlę 16/44,1 A/D/A (patrz rys.1). W przeciwieństwie do poprzednich badań, nasze testy miały ujawnić wszelkie ewentualne różnice dźwiękowe pomiędzy audio w wysokiej rozdzielczości i CD, z których wiele, według publikowanych twierdzeń, często występują w obrębie uznanego pasma akustycznego. Teoretycznie zalety sygnału o wysokiej rozdzielczości nie powinny przetrwać degradacji w "szyjce od butelki" 16/44,1 a powstałe różnice byłyby słyszalne.

Z pomocą około 60 członków Boston Audio Society i wielu innych zainteresowanych osób, odbyła się seria podwójnie ślepych testów (A /B/X) i trwała około rok. Wiele rodzajów muzyki i głosu znalazło się w materiale do odsłuchów od klasyki (chóry, kameralistyka, fortepian, orkiestry), do jazzu, popu i rocka. Słuchacze to mężczyźni i kobiety w bardzo zróżnicowanym wieku, o różnych zdolnościach i poziomie doświadczenia z muzyką i audio; wiele z nich to zawodowcy audio lub studenci tej dziedziny.

Większość badań przeprowadzono z użyciem pary wysoko cenionych głośników pełnozakresowych o wyrównanej charakterystyce w pomieszczeniu odsłuchowym w cichej okolicy o poziomie hałasu 19 dBA SPL, razem z całą elektroniką (patrz rys. 2). Mieliśmy również konfiguracje testowe w kilku innych lokalizacjach: w okolicy Bostonu z bardzo dużymi czterodrożnymi monitorami studyjnymi w miejscowym uniwersyteckim zakładzie dźwięku, kolejną z dużymi monitorami zasilanymi wzmacniaczami wysokiej mocy w specjalnie zaprojektowanej przestrzeni odsłuchowej (słuchaczami w tym badania byli studenci wydziału nagrań); oraz wysokiej klasy prywatnego pokoju odsłuchowego i sprzętu high-end z bardzo dobrze ocenianymi głośnikami elektrostatycznymi i bardzo drogą elektroniką i kablami. We wszystkich miejscach wykonano nieformalne testy górnych granic słyszenia u badanych by zobaczyć czy istnieje korelacja pomiędzy tym parametrem i słyszalnością różnic.

Do pętli CD wykorzystaliśmy dobrze ocenianą profesjonalną nagrywarkę CD z monitorowaniem w czasie rzeczywistym. Poziomy w obu systemach zostały dobrane w granicach 0,1 dB przy użyciu bardzo dokładnej analogowej regulacji stopniowej wzmocnienia, która była zawsze w drodze sygnału 16/44.1. Dźwięk był przełączany przez komparator ABX CS-5 podwójnie ślepej próby porównawczej (patrz rys. 3).

Dźwięk o wysokiej rozdzielczości oferuje niższy poziom szumu cyfrowego, więc poziom odtwarzania jest istotnym czynnikiem. Czy niższy szum ma jakieś praktyczne konsekwencje biorąc pod uwagę nowoczesne sposoby kompresji (chodzi o kompresory używane w studiach nagraniowych – przyp. tłum), poziom szumu w mikrofonach, przedwzmacniaczach mikrofonowych i stołach mikserskich? Ustaliliśmy, że większość nagrań SACD i DVD-A dawało efekt, który można by nazwać odtwarzaniem realistycznym (czyli słuchacz słyszał źródło głośno i wyraźnie, z naturalną barwą i właściwą skalą, ale bez uczucia dyskomfortu) przy takim wzmocnieniu systemu, że częstotliwość pasma oktawy szumu 1 kHz zapisana na średnim poziomie -16 dBFS dawał SPL (ciśnienie dźwięku) w miejscu odsłuchowym nieważone 85 dB. Dla niektórych klasycznych nagrań z bardzo szerokim zakresem dynamiki, słuchano od czasu do czasu z poziomem 5-7 dB wyższym niż ten.

Sygnał testowy, który użyliśmy do ustawienia 85 dB SPL naszego standardowego wzmocnienia jest dostępny na stronie internetowej Boston Audio Society. Schodzący frequency sweep stosowany na tym samym poziomie głośności jako szybki test górnego limitu słuchu naszych słuchaczy, można znaleźć na tej samej stronie, www.bostonaudiosociety.org/media.



Rys. 1. Schemat blokowy blokowy instalacji testowej dla podwójnie ślepego testu porównania odtwarzania stereo o wysokiej rozdzielczości z takim samym sygnałem przepuszczonym przez łańcuch 16/44,1 A/D/ A.


2 WYNIKI

Wyniki badań dla wykrywalności odtwarzania w pętli 16/44,1 na SACD / DVD-A były takie same jak zwyczajne zgadywanie: 49,82%. Było 554 prób i 276 poprawnych odpowiedzi. Jedyne wyjątki były dla warunków bez sygnału i przy wysokim wzmocnieniu, gdy różnica w poziomie szumu z dwóch technologii, starej i nowej, była dobrze słyszalna. (chodzi o poziom szumu generowany przez dodaną pętlę 16/44,1 – przyp. tłum)

W miarę postępowania testu, wielokrotnie sortowano dane według korelacji wieku, płci, górnej częstotliwości słyszenia lub doświadczenia. Korelacje takie się nie pojawiły. W szczególności, przy muzyce na normalnym poziomie głośności, jak określono wcześniej, audiofile i/lub zawodowi inżynierowie dźwięku mieli 246 poprawnych odpowiedzi na 467 prób, co daje 52,7% poprawnych odpowiedzi. Kobiety miały 18 na 48, czyli 37,5% poprawne. Osoby zdolne usłyszeć dźwięki powyżej 15 kHz miały 116 trafień na 256 prób, czyli 45,3% poprawnych; słuchacze w wieku 14-25 lat (którzy, jak to się okazało, byli tą samą grupą), również właściwie odgadli 116 razy w 256
badań, 45,3%. "Najlepszy" wynik osiągnął jeden słuchacz tylko jeden raz i było to 8 na 10, co wciąż jest za mało do osiągnięcia pożądanego 95% poziomu pewności. Były dwa wyniki 7/10. Wszystkie inne próby były zawsze gorsze niż 70% poprawnych odpowiedzi.

Co więcej, żaden z bardziej skomplikowanych i kosztownych systemów odtwarzania (do których badania byli dedykowani audiofile, zaangażowani amatorzy, aktywni studenci w profesji reżyserii dźwięku i/lub doświadczeni w pracy specjaliści) nie ujawnił wykrywalnych różnice na muzyce, odtwarzanej z głośnością na poziomie, jak to zdefiniowano poprzednio.



Rys. 2. Miejsce odsłuchu dla większości testów.

W jednym krótkim teście z dwoma osobami dodaliśmy 14 dB do wspomnianego poziomu odniesienia by przetestować dwa źródła bez sygnału wejściowego, aby sprawdzić, czy poziom
szumu z kanału audio CD może okazać się słyszalny. Chociaż jeden z testowanych był niepewny jego zdolności do rozpoznania szumu, obaj osiągnęli wyniki 10/10 w wykrywaniu pętli CD. (Jeszcze nie określimy progu tego efektu. Dzięki wzmocnieniu 14 dB powyżej odniesienia,wykrywanie wyższego poziomu szumów łańcucha CD było łatwe, bez niepewności. Testy z innymi to osobami to potwierdziły.)

Źródła o wysokiej rozdzielczości, gdy były odtwarzane na poziomie +14 dB były nieprzyjemnie (często nieznośnie) głośne, a współczesne agresywnie masterowane płyty CD jeszcze bardziej.
Ton pomieszczenia i/lub szum przedwzmacniacza w prawie wszystkich nagraniach maskował poziom szumu 16/44,1 choć znaleźliśmy jeden lub dwa nagrania, przy których była wykrywalna
różnica tonu w pomieszczeniu dla wysterowania 20 dB lub więcej powyżej poziomu odniesienia. Przy tych bardzo wysokich poziomach mogliśmy również usłyszeć subtelne błędy dekodowania przy niskim poziomie w prawie wszystkich najdroższych odtwarzaczach o wysokiej rozdzielczości.

Z wielu różnych nagrań, których użyliśmy okazało się, że prawie żaden program muzyczny lub wokalny, miejsce nagrywania, instrument lub wykonawca nie przekracza możliwości dobrze
zrealizowanej pętli nagrywania/odtwarzania w jakości CD. CD ma odpowiednie pasmo i zakres dynamiki dla każdego zadania domowej reprodukcji i rzadko się zdarza, że miejsce odtwarzania jest tak ciche, by wykryć 16-bitowy szum naszej pętli A/D/A, która nie ma kształtowania szumu i dlatego była mniej optymalna tym zakresie, nawet na głośnościach ponad nasz poziom odniesienia.

3 WNIOSKI

Analizowaliśmy wszystkie dane z badań według rodzaju muzyki; szczegółowego programu; rodzaju technologii wysokiej rozdzielczości; roku powstania nagrań; wieku słuchaczy, płci, doświadczenia i zakresu słyszanych przez badanych częstotliwości. Żadna z tych zmiennych nie wykazały korelacji z wynikami, a odpowiedzi nie różniły się od takich uzyskanych przez rzut monetą.

Wcześniejsze cytowane prace, niektóre z samego początku ery CD i niektóre nowsze potwierdziły
nasz wynik. Z powodu rozpowszechnienia się w ciągu ostatniej dekady anegdot o "high-rez", zakończonych twierdzeniem Stuarta, czuliśmy potrzebę pójść dalej i wykonać rzetelny, nieskomplikowany i łatwy do zrozumienia, z dopasowaniem poziomu, podwójnie ślepy test, żeby określić, czy technologia 16/44,1 degraduje w zauważalnym stopniu dźwięk najlepszych płyt w wysokiej rozdzielczości. Użyliśmy dużej i urozmaiconej grupy poważnych słuchaczy; przeprowadziliśmy testy przy użyciu kilku rodzajów pomieszczeń i systemów o wysokiej jakości odtwarzania; pracowaliśmy tak długo, jak uważaliśmy to za konieczne dla wykazania przejrzystości standardu CD.

Bardzo trudno jest wykorzystać negatywne wyniki aby udowodnić niesłyszalność danego zjawiska lub procesu. Zawsze jest możliwość, że inny system lub bardziej wyrafinowana para uszu ujawni
różnicę. Ale zebraliśmy wystarczająco dużo danych, wykorzystując w wystarczająco zróżnicowane wydajne systemy i słuchaczy aby ciężar dowodu był wystarczający. Dalsze zarzuty, że precyzyjnie kodowane 16/44.1 wyraźnie degraduje sygnał wysokiej rozdzielczości muszą być poparte przez odpowiednio kontrolowane podwójnie ślepe testy.


Rys. 3. Schemat blokowy na rys. 1.

4 UWAGA O NAGRANIACH W WYSOKIEJ ROZDZIELCZOŚCI

Chociaż nasze testy nie uzasadniły deklarowanej przewagi kodowania w wysokiej rozdzielczości dla dwukanałowego audio, jedna tendencja stała się oczywista bardzo szybko i utrzymywała się w czasie testów: praktycznie wszystkie nagrania SACD i DVD-A brzmiały lepiej niż większość CD - czasem o wiele lepiej. Gdyby nie "zdegradowany" do jakości CD dźwięk i ślepy test do sprawdzenia słyszalnych różnic, bylibyśmy skłonni przypisać tę wyższość dźwięku procesom rejestracji używanym do ich produkcji. Prawdopodobne powody niezwykłej jakości dźwięku tych nagrań wyszły na jaw się w dyskusji z niektórymi inżynierami pracującymi nad takimi projektami.

Ta część biznesu to rynek niszowy, w którym użytkownicy są wybrani pod względem wymagań słuchowych jak i potrzeby kupowania drogiego sprzętu, ustawienia go poprawnie i uważnego odsłuchu w cichym otoczeniu.

Częściowo ze względu, że takie nagrania nie są przeznaczone dla masowego rynku konsumenckiego, inżynierzy i producenci mają swobodę w produkcji nagrań, które brzmią tak dobrze jak jak to możliwe, bez kompresji lub equalizacji sygnału w celu przystosowania do słabszych systemów i przypadkowych warunków odsłuchu. Te nagrania wydają się być wykonane z wielką starannością i manifestują przywiązanie, inżynierowie starają się zadowolić ich samych i innych zainteresowanych. Brzmią znakomicie, płyta w płytę. Płyty audio o wysokiej rozdzielczości nie mają przytłaczającej większości materiału stłoczonych w najwyższych 20 (a nawet 10) dB dostępnego zakresu dynamicznego, jak to robi obecnie wiele płyt CD.

Uzyskane wyniki badań wskazują, że wszystkie z tych nagrań mogą być wydane na konwencjonalnych płytach CD bez brzmieniowej różnicy. Nie będą one jednak mieć łatwej
drogi do domów słuchaczy z takimi systemami i nawykami, by je mogli docenić. Tajemnica, przynajmniej dla dwukanałowego stereo, wydaje się tkwić się nie w wielobitowości nagrań, ale w wielobitowym rynku.

* Rękopis powstał 19 października 2006; poprawione 05 kwietnia 2007 i 15 czerwca.

5 Referencje

[1] J. R. Stuart, “Coding for High-Resolution Audio Systems,” J. Audio Eng. Soc., vol. 52, pp. 117–144 (2004 Mar.).
[2] G. Plenge, H. Jakubowski, and P. Scho ¨ne, “Which Bandwidth Is Necessary for Optimal Sound Transmission?,” J. Audio Eng. Soc., vol. 28, pp. 114–119 (1980 Mar.).
[3] T. Nishiguchi, K. Hamasaki, M. Iwaki, and A. Ando, “Perceptual Discrimination between Musical Sounds with and without Very High Frequency Components,” presented at the 115th Convention of the Audio Engineering Society, J. Audio Eng. Soc. (Abstracts), vol., 51, p. 1222 (2003 Dec.), convention paper 5876.
[4] D. Blech and M. Yang, “DVD-Audio versus SACD: Perceptual Discrimination of Digital Coding Formats,” presented at the 116th Convention of the Audio Engineering Society, Berlin, Germany, 2004 May 8–11, convention paper 6086

AUTORZY

Brad Meyer was born in Baltimore, MD, in 1942 and received a B.A. degree from Harvard College, Cambridge, MA. He has been recording concerts since the late 1950s and worked making measurements, calibrating instruments, reducingdata,writingreports,andlearningacousticsatBoltBeranek andNewmanfrom1966to1972.Hestartedhisowncompany, Point One Audio, in the late 1970s. He does location recording and digital editing of classical and some folk material. Mr. Meyer has been on the executive committee of the AES Boston Section since the early 1980s and served two years as its chair. In addition to his past duties as writer and sometime editor of the Boston Audio Society Speaker newsletter and Society president, he has published audio articles for the Boston Phoenix, High Fidelity, Stereo Review, and Stereophile.

David Moran was born in Springfield, OH, in 1947. He studied history and literature at the University of Rochester, NY and Brandeis University, Waltham, MA, where he received a B.A. degree. He has an M.A. degree in literature from Columbia University, New York. He is a writer and editor, with particular interest in audio, music, and technology. He was audio editor (also
managing editor) of the Boston Phoenix during the 1970s and worked for dbx engineering through the 1980s. He has been president of the Boston Audio Society and editor of its BAS Speaker newsletter, and has reviewed loudspeakers for CD Review, Digital Audio, Speaker Builder, Car
Stereo Review, and currently for Sensible Sound magazine and the BAS Speaker. He also has annotated and produced CDs and written about music (classical and popular) for publications from the Boston Globe, Phoenix, and Herald to Stereo Review, has received two NEA fellowships for

classical criticism, and recently helped edit the NPR Listeners’ Encyclopedia of Classical Music. He currently works as a technical writer at BBN Technologies in Cambridge, MA.

Brak komentarzy:

Prześlij komentarz