Słyszalność
pętli A/D/A w standardzie CD wstawionej w tor
odtwarzania
dźwięku o wysokiej rozdzielczości*
E. BRAD
MEYER, AES i David R. MORAN, AES
(EbradMeyer @
att.net) (drmoran @ aol.com)
Boston Audio
Society, Lincoln, MA 01773, USA
Regularnie
publikuje się lub kolportuje w formie anegdot opinie o wyższej
jakości dźwięku
dwukanałowego
zakodowanego z użyciem dłuższych słów bitowych i/lub w wyższych
częstotliwości próbkowania niż Standard CD 16-bit/44,1 kHz.
Autorzy przedstawiają sprawozdanie z serii badań z podwójnie
ślepym testem porównawczym nagrań odtwarzanych w wysokiej
rozdzielczości z wyjścia analogowego odtwarzacza wysokiej
rozdzielczości z tym samym sygnałem przechodzącym przez „szyjkę
od butelki” 16-bit/44,1 kHz. Badania prowadzano przez ponad rok, z
wykorzystaniem różnych systemów i różnych grup słuchaczy.
Systemy składały się z drogich profesjonalnych głośników, a
jeden system high-end miał głośniki elektrostatyczne i drogie
komponenty i
kable. Grupa słuchaczy obejmuje profesjonalnych inżynierów
nagraniowych, studentów uniwersytetu z programem rejestracji dźwięku
i zagorzałych audiofilów. Wyniki badań wskazują, że obecność
pętli A/D/A w jakości CD była niewykrywalna przy normalnych do
głośnych poziomach dźwięku, przez któregokolwiek ze słuchaczy
na żadnym z systemów odtwarzania. Szum pętli jakości CD słychać
było tylko przy bardzo podwyższonym poziomie głośności.
0) KULISY
Od momentu
przyjęcia standardu formatu CD PCM 16-bitów/44,1 kHz ponad 25 lat
temu, jego jakość jako nośnika zapisu był obiektem regularnej
krytyki, zarówno w subiektywnej prasie audio jak i wśród
profesjonalistów. Zazwyczaj koncentrowano się na szorstkości,
braku głębi lub na zimnym, sterylnym dźwięku. Jednak ślepe testy
porównawcze płyt z ich taśmami matkami wykazały, że te poglądy
są nieuprawnione. W tym zakresie standard CD był przejrzysty, bez
względu na to czy pierwotne źródło było cyfrowe, czy analogowe.
Tymczasem
techniki cyfrowe ewoluowały, a w kilku ostatnich latach pojawiły
się dwie nowe technologie dźwięku o wysokiej rozdzielczości,
Super Audio CD (SACD) i DVD-Audio jako alternatywy.
Przydatność
zwiększonego zakresu dynamiki gwarantowanego przez większą długość
słowa dla miksowania nigdy nie była poddawana w wątpliwość. Oba
nowe systemy umożliwiały również zapis wielokanałowy będący
istotną potencjalną zaletą odtwarzania. Ale pomijając te uznawane
możliwości, każdy z tych formatów okrzyknięto jako oferujący
brzmienie o wyższej jakości. Jak zapewniał licencjodawca w tym
dokumencie[1]:
Długotrwała
krytyka audiofilska płyt CD polega na tym
że brakuje im
rozdzielczości, aby reprodukować wszystkie szczegóły w materiale
muzycznym. ...
Obecna wysoka jakości dźwięku ukazuje, że
CD to "wąskie
gardło" ... Audio w wysokiej rozdzielczości
gwarantuje
lepszy dźwięk niż płyty CD, a jego potencjał
wykazano już
dla nośników, które odtwarzając przenoszą szersze
pasmo ... i
większy zakres dynamiczny ... Dowody doświadczalne
i amatorskie
obserwacje wskazują, że wyższe
próbkowanie
"brzmi lepiej." Zazwyczaj obserwuje się, że przy
wyższej
częstotliwości próbkowania dźwięk jest klarowniejszy,
gładszy, ma
lepszą definicję niskich częstotliwości i jest bardziej
"naturalny".
Z doświadczenia
autora wynika,
że wyższe
próbkowanie może prowadzić do lepszego rozróżniania
pierwszego i
dalszego planu. "Obiekty" są lepiej
oddzielone od
akustycznego tła i
są bardziej
przejrzyste i "kompletne".
Osoby prywatne
i czasopisma o tematyce inżynierii dźwięku deklarowały
wielokrotnie, że oba formaty oferują całkowicie oczywistą poprawę
w stosunku do standardu CD.
Takie
twierdzenia wykazują brak świadomości istnienia wcześniejszych
prac badawczych [2] [3] [4], i wszystkie nowsze teksty bazują na
jednym tylko parametrze: możliwości, że nagrania w wysokiej
rozdzielczości oferuje poprawę brzmienia przez potencjalne
rozszerzenie zakresu rejestrowania wysokich częstotliwości
niezależnie od tego, że wszyscy uznawali u zarania ery CD, że
jakość jest wystarczająca, [2] a nawet uważa się, że szerokość
pasma może być większa niż to konieczne.
1 TESTY
Pomimo roszczeń
co do SACD i DVD-A, o ile autorom to jest wiadome, nie wykonano
prawidłowo kontrolowanych ślepych testów wykazujących wyższość
jakości dźwięku w porównaniu do CD; przynajmniej takie badania
nie zostały opublikowane. W momencie wydania tekstu przewodniego J.
R. Stuarta “Coding for High-Resolution Audio Systems,” przez J.
Audio Eng. Soc.[1], stało się jasne, że czas najwyższy
rozstrzygnąć sprawy naukowo. Ta praca opisuje podwójnie ślepe
testy porównawcze odtwarzania dźwięku stereo w wysokiej
rozdzielczości i tego samego sygnału przepuszczonego przez pętlę
16/44,1 A/D/A (patrz rys.1). W przeciwieństwie do poprzednich badań,
nasze testy miały ujawnić wszelkie ewentualne różnice dźwiękowe
pomiędzy audio w wysokiej rozdzielczości i CD, z których wiele,
według publikowanych twierdzeń, często występują w obrębie
uznanego pasma akustycznego. Teoretycznie zalety sygnału o wysokiej
rozdzielczości nie powinny przetrwać degradacji w "szyjce od
butelki" 16/44,1 a powstałe różnice byłyby słyszalne.
Z pomocą około
60 członków Boston Audio Society i wielu innych zainteresowanych
osób, odbyła się seria podwójnie ślepych testów (A /B/X) i
trwała około rok. Wiele rodzajów muzyki i głosu znalazło się w
materiale do odsłuchów od klasyki (chóry, kameralistyka,
fortepian, orkiestry), do jazzu, popu i rocka. Słuchacze to
mężczyźni i kobiety w bardzo zróżnicowanym wieku, o różnych
zdolnościach i poziomie doświadczenia z muzyką i audio; wiele z
nich to zawodowcy audio lub studenci tej dziedziny.
Większość
badań przeprowadzono z użyciem pary wysoko cenionych głośników
pełnozakresowych o wyrównanej charakterystyce w pomieszczeniu
odsłuchowym w cichej okolicy o poziomie hałasu 19 dBA SPL, razem z
całą elektroniką (patrz rys. 2). Mieliśmy również konfiguracje
testowe w kilku innych lokalizacjach: w okolicy Bostonu z bardzo
dużymi czterodrożnymi monitorami studyjnymi w miejscowym
uniwersyteckim zakładzie dźwięku, kolejną z dużymi monitorami
zasilanymi wzmacniaczami wysokiej mocy w specjalnie zaprojektowanej
przestrzeni odsłuchowej (słuchaczami w tym badania byli studenci
wydziału nagrań); oraz wysokiej klasy prywatnego pokoju
odsłuchowego i sprzętu high-end z bardzo dobrze ocenianymi
głośnikami elektrostatycznymi i bardzo drogą elektroniką i
kablami. We wszystkich miejscach wykonano nieformalne testy górnych
granic słyszenia u badanych by zobaczyć czy istnieje korelacja
pomiędzy tym parametrem i słyszalnością różnic.
Do pętli CD
wykorzystaliśmy dobrze ocenianą profesjonalną nagrywarkę CD z
monitorowaniem w czasie rzeczywistym. Poziomy w obu systemach zostały
dobrane w granicach 0,1 dB przy użyciu bardzo dokładnej analogowej
regulacji stopniowej wzmocnienia, która była zawsze w drodze
sygnału 16/44.1. Dźwięk był przełączany przez komparator ABX
CS-5 podwójnie ślepej próby porównawczej (patrz rys. 3).
Dźwięk o
wysokiej rozdzielczości oferuje niższy poziom szumu cyfrowego, więc
poziom odtwarzania jest istotnym czynnikiem. Czy niższy szum ma
jakieś praktyczne konsekwencje biorąc pod uwagę nowoczesne sposoby
kompresji (chodzi o kompresory używane w studiach nagraniowych –
przyp. tłum), poziom szumu w mikrofonach, przedwzmacniaczach
mikrofonowych i stołach mikserskich? Ustaliliśmy, że większość
nagrań SACD i DVD-A dawało efekt, który można by nazwać
odtwarzaniem realistycznym (czyli słuchacz słyszał źródło
głośno i wyraźnie, z naturalną barwą i właściwą skalą, ale
bez uczucia dyskomfortu) przy takim wzmocnieniu systemu, że
częstotliwość pasma oktawy szumu 1 kHz zapisana na średnim
poziomie -16 dBFS dawał SPL (ciśnienie dźwięku) w miejscu
odsłuchowym nieważone 85 dB. Dla niektórych klasycznych nagrań z
bardzo szerokim zakresem dynamiki, słuchano od czasu do czasu z
poziomem 5-7 dB wyższym niż ten.
Sygnał
testowy, który użyliśmy do ustawienia 85 dB SPL naszego
standardowego wzmocnienia jest dostępny na stronie internetowej
Boston Audio Society. Schodzący frequency sweep stosowany na tym
samym poziomie głośności jako szybki test górnego limitu słuchu
naszych słuchaczy, można znaleźć na tej samej stronie,
www.bostonaudiosociety.org/media.
Rys. 1. Schemat
blokowy blokowy instalacji testowej dla podwójnie ślepego testu
porównania odtwarzania stereo o wysokiej rozdzielczości z takim
samym sygnałem przepuszczonym przez łańcuch 16/44,1 A/D/ A.
2 WYNIKI
Wyniki badań
dla wykrywalności odtwarzania w pętli 16/44,1 na SACD / DVD-A były
takie same jak zwyczajne zgadywanie: 49,82%. Było 554 prób i 276
poprawnych odpowiedzi. Jedyne wyjątki były dla warunków bez
sygnału i przy wysokim wzmocnieniu, gdy różnica w poziomie szumu z
dwóch technologii, starej i nowej, była dobrze słyszalna. (chodzi
o poziom szumu generowany przez dodaną pętlę 16/44,1 – przyp.
tłum)
W miarę
postępowania testu, wielokrotnie sortowano dane według korelacji
wieku, płci, górnej częstotliwości słyszenia lub doświadczenia.
Korelacje takie się nie pojawiły. W szczególności, przy muzyce na
normalnym poziomie głośności, jak określono wcześniej, audiofile
i/lub zawodowi inżynierowie dźwięku mieli 246 poprawnych
odpowiedzi na 467 prób, co daje 52,7% poprawnych odpowiedzi. Kobiety
miały 18 na 48, czyli 37,5% poprawne. Osoby zdolne usłyszeć
dźwięki powyżej 15 kHz miały 116 trafień na 256 prób, czyli
45,3% poprawnych; słuchacze w wieku 14-25 lat (którzy, jak to się
okazało, byli tą samą grupą), również właściwie odgadli 116
razy w 256
badań, 45,3%.
"Najlepszy" wynik osiągnął jeden słuchacz tylko jeden
raz i było to 8 na 10, co wciąż jest za mało do osiągnięcia
pożądanego 95% poziomu pewności. Były dwa wyniki 7/10. Wszystkie
inne próby były zawsze gorsze niż 70% poprawnych odpowiedzi.
Co więcej,
żaden z bardziej skomplikowanych i kosztownych systemów odtwarzania
(do których badania byli dedykowani audiofile, zaangażowani
amatorzy, aktywni studenci w profesji reżyserii dźwięku i/lub
doświadczeni w pracy specjaliści) nie ujawnił wykrywalnych różnice
na muzyce, odtwarzanej z głośnością na poziomie, jak to
zdefiniowano poprzednio.
Rys. 2. Miejsce
odsłuchu dla większości testów.
W jednym krótkim teście z dwoma osobami dodaliśmy 14 dB do wspomnianego poziomu odniesienia by przetestować dwa źródła bez sygnału wejściowego, aby sprawdzić, czy poziom
szumu z kanału
audio CD może okazać się słyszalny. Chociaż jeden z testowanych
był niepewny jego zdolności do rozpoznania szumu, obaj osiągnęli
wyniki 10/10 w wykrywaniu pętli CD. (Jeszcze nie określimy progu
tego efektu. Dzięki wzmocnieniu 14 dB powyżej
odniesienia,wykrywanie wyższego poziomu szumów łańcucha CD było
łatwe, bez niepewności. Testy z innymi to osobami to potwierdziły.)
Źródła o
wysokiej rozdzielczości, gdy były odtwarzane na poziomie +14 dB
były nieprzyjemnie (często nieznośnie) głośne, a współczesne
agresywnie masterowane płyty CD jeszcze bardziej.
Ton
pomieszczenia i/lub szum przedwzmacniacza w prawie wszystkich
nagraniach maskował poziom szumu 16/44,1 choć znaleźliśmy jeden
lub dwa nagrania, przy których była wykrywalna
różnica tonu
w pomieszczeniu dla wysterowania 20 dB lub więcej powyżej poziomu
odniesienia. Przy tych bardzo wysokich poziomach mogliśmy również
usłyszeć subtelne błędy dekodowania przy niskim poziomie w prawie
wszystkich najdroższych odtwarzaczach o wysokiej rozdzielczości.
Z wielu różnych
nagrań, których użyliśmy okazało się, że prawie żaden program
muzyczny lub wokalny, miejsce nagrywania, instrument lub wykonawca
nie przekracza możliwości dobrze
zrealizowanej
pętli nagrywania/odtwarzania w jakości CD. CD ma odpowiednie pasmo
i zakres dynamiki dla każdego zadania domowej reprodukcji i rzadko
się zdarza, że miejsce odtwarzania jest tak ciche, by wykryć
16-bitowy szum naszej pętli A/D/A, która nie ma kształtowania
szumu i dlatego była mniej optymalna tym zakresie, nawet na
głośnościach ponad nasz poziom odniesienia.
3 WNIOSKI
Analizowaliśmy
wszystkie dane z badań według rodzaju muzyki; szczegółowego
programu; rodzaju technologii wysokiej rozdzielczości; roku
powstania nagrań; wieku słuchaczy, płci, doświadczenia i zakresu
słyszanych przez badanych częstotliwości. Żadna z tych zmiennych
nie wykazały korelacji z wynikami, a odpowiedzi nie różniły się
od takich uzyskanych przez rzut monetą.
Wcześniejsze
cytowane prace, niektóre z samego początku ery CD i niektóre
nowsze potwierdziły
nasz wynik. Z
powodu rozpowszechnienia się w ciągu ostatniej dekady anegdot o
"high-rez", zakończonych twierdzeniem Stuarta, czuliśmy
potrzebę pójść dalej i wykonać rzetelny, nieskomplikowany i
łatwy do zrozumienia, z dopasowaniem poziomu, podwójnie ślepy
test, żeby określić, czy technologia 16/44,1 degraduje w
zauważalnym stopniu dźwięk najlepszych płyt w wysokiej
rozdzielczości. Użyliśmy dużej i urozmaiconej grupy poważnych
słuchaczy; przeprowadziliśmy testy przy użyciu kilku rodzajów
pomieszczeń i systemów o wysokiej jakości odtwarzania;
pracowaliśmy tak długo, jak uważaliśmy to za konieczne dla
wykazania przejrzystości standardu CD.
Bardzo trudno
jest wykorzystać negatywne wyniki aby udowodnić niesłyszalność
danego zjawiska lub procesu. Zawsze jest możliwość, że inny
system lub bardziej wyrafinowana para uszu ujawni
różnicę. Ale
zebraliśmy wystarczająco dużo danych, wykorzystując w
wystarczająco zróżnicowane wydajne systemy i słuchaczy aby ciężar
dowodu był wystarczający. Dalsze zarzuty, że precyzyjnie kodowane
16/44.1 wyraźnie degraduje sygnał wysokiej rozdzielczości muszą
być poparte przez odpowiednio kontrolowane podwójnie ślepe testy.
Rys. 3.
Schemat blokowy na rys. 1.
4 UWAGA O
NAGRANIACH W WYSOKIEJ ROZDZIELCZOŚCI
Chociaż nasze
testy nie uzasadniły deklarowanej przewagi kodowania w wysokiej
rozdzielczości dla dwukanałowego audio, jedna tendencja stała się
oczywista bardzo szybko i utrzymywała się w czasie testów:
praktycznie wszystkie nagrania SACD i DVD-A brzmiały lepiej niż
większość CD - czasem o wiele lepiej. Gdyby nie "zdegradowany"
do jakości CD dźwięk i ślepy test do sprawdzenia słyszalnych
różnic, bylibyśmy skłonni przypisać tę wyższość dźwięku
procesom rejestracji używanym do ich produkcji. Prawdopodobne powody
niezwykłej jakości dźwięku tych nagrań wyszły na jaw się w
dyskusji z niektórymi inżynierami pracującymi nad takimi
projektami.
Ta część
biznesu to rynek niszowy, w którym użytkownicy są wybrani pod
względem wymagań słuchowych jak i potrzeby kupowania drogiego
sprzętu, ustawienia go poprawnie i uważnego odsłuchu w cichym
otoczeniu.
Częściowo ze
względu, że takie nagrania nie są przeznaczone dla masowego rynku
konsumenckiego, inżynierzy i producenci mają swobodę w produkcji
nagrań, które brzmią tak dobrze jak jak to możliwe, bez kompresji
lub equalizacji sygnału w celu przystosowania do słabszych systemów
i przypadkowych warunków odsłuchu. Te nagrania wydają się być
wykonane z wielką starannością i manifestują przywiązanie,
inżynierowie starają się zadowolić ich samych i innych
zainteresowanych. Brzmią znakomicie, płyta w płytę. Płyty audio
o wysokiej rozdzielczości nie mają przytłaczającej większości
materiału stłoczonych w najwyższych 20 (a nawet 10) dB dostępnego
zakresu dynamicznego, jak to robi obecnie wiele płyt CD.
Uzyskane wyniki
badań wskazują, że wszystkie z tych nagrań mogą być wydane na
konwencjonalnych płytach CD bez brzmieniowej różnicy. Nie będą
one jednak mieć łatwej
drogi do domów
słuchaczy z takimi systemami i nawykami, by je mogli docenić.
Tajemnica, przynajmniej dla dwukanałowego stereo, wydaje się tkwić
się nie w wielobitowości nagrań, ale w wielobitowym rynku.
* Rękopis
powstał 19 października 2006; poprawione 05 kwietnia 2007 i 15
czerwca.
5 Referencje
[1] J. R.
Stuart, “Coding for High-Resolution Audio Systems,” J. Audio Eng.
Soc., vol. 52, pp. 117–144 (2004 Mar.).
[2] G. Plenge,
H. Jakubowski, and P. Scho ¨ne, “Which Bandwidth Is Necessary for
Optimal Sound Transmission?,” J. Audio Eng. Soc., vol. 28, pp.
114–119 (1980 Mar.).
[3] T.
Nishiguchi, K. Hamasaki, M. Iwaki, and A. Ando, “Perceptual
Discrimination between Musical Sounds with and without Very High
Frequency Components,” presented at the 115th Convention
of the Audio Engineering Society, J. Audio Eng. Soc. (Abstracts),
vol., 51, p. 1222 (2003 Dec.), convention paper 5876.
[4] D. Blech
and M. Yang, “DVD-Audio versus SACD: Perceptual Discrimination of
Digital Coding Formats,” presented at the 116th Convention of the
Audio Engineering Society, Berlin, Germany, 2004 May 8–11,
convention paper 6086
AUTORZY
Brad Meyer was
born in Baltimore, MD, in 1942 and received a B.A. degree from
Harvard College, Cambridge, MA. He has been recording concerts since
the late 1950s and worked making measurements, calibrating
instruments,
reducingdata,writingreports,andlearningacousticsatBoltBeranek
andNewmanfrom1966to1972.Hestartedhisowncompany, Point One Audio, in
the late 1970s. He does location recording and digital editing of
classical and some folk material. Mr. Meyer has been on the executive
committee of the AES Boston Section since the early 1980s and served
two years as its chair. In addition to his past duties as writer and
sometime editor of the Boston Audio Society Speaker newsletter and
Society president, he has published audio articles for the Boston
Phoenix, High Fidelity, Stereo Review, and Stereophile.
David Moran was
born in Springfield, OH, in 1947. He studied history and literature
at the University of Rochester, NY and Brandeis University, Waltham,
MA, where he received a B.A. degree. He has an M.A. degree in
literature from Columbia University, New York. He is a writer and
editor, with particular interest in audio, music, and technology. He
was audio editor (also
managing
editor) of the Boston Phoenix during the 1970s and worked for dbx
engineering through the 1980s. He has been president of the Boston
Audio Society and editor of its BAS Speaker newsletter, and has
reviewed loudspeakers for CD Review, Digital Audio, Speaker Builder,
Car
Stereo Review,
and currently for Sensible Sound magazine and the BAS Speaker. He
also has annotated and produced CDs and written about music
(classical and popular) for publications from the Boston Globe,
Phoenix, and Herald to Stereo Review, has received two NEA
fellowships for
classical
criticism, and recently helped edit the NPR Listeners’ Encyclopedia
of Classical Music. He currently works as a technical writer at BBN
Technologies in Cambridge, MA.
Brak komentarzy:
Prześlij komentarz