Miski do mleka

Masajowie uważają, iż mycie wodą naczyń do mleka daje mleku przykry zapach; dlatego myją te naczynia w krowim moczu. Za Kopalińskim

O dźwięku cyfrowanym

Zadeklarowałem jakiś czas temu chęć wskazania niedociągnięć w tekście Orlińskiego o MP3, który wyszedł niedawno w wyborcza.biz w dwóch częściach zatytułowanych Jak oszukać ludzkie ucho? Karlheinz Brandenburg opowiada jak stworzył MP3 oraz Jak snobizm i piractwo uratowały MP3.

Może by mi się chęć owa rozeszła po kościach, ale ^wo żalił się na blipie, że miała być hejtnotka, a nie ma, że dla jego Znanego i Szanowanego kolegi czas znalazłem w trymiga, i że wogle. Pod taką presją nie mogę się nie ugiąć, więc oto notka. Nawet nie bardzo hejt.

Bo w pierwszych słowach chciałem pochwalić pomysł i chęć napisania o MP3. Jestem entuzjastą opowieści o tym, jak rozmaite rzeczy działają i jaka historia za owymi rzeczami stała. Zawsze byłem – w dziecięctwie uwielbiałem książeczki o tym, jak działa samochód, a jak telewizor. O tym, jak Bertha Benz pojechała w demo-podróż samochodem konstrukcji męża, i jak John Baird zrobił pierwszy telewizor oparty na mechanicznej tarczy Nipkowa.

Opowieść o MP3 jak najbardziej podpada pod mój entuzjazm, kodowanie dźwięku cyfrowego metodą zwaną dziś MP3 to przecież sprytna rzecz, której używamy na codzień – jej samej, lub pokrewnych, w różnych aspektach ulepszonych, jak AAC czy Vorbis. I rzecz, która – jak wiele innych, ale zawsze warto o tym przypominać – nie wzięła się szast-prast znikąd, czy z natchnienia samotnego geniusza, lecz ze stania na ramionach gigantów.

Szejm przeto on Duży Format, który – jak bodajże na blipie powiedział ^wo – nie uznał tekstu za godny swoich łamów. Może ktoś uznał, że to takie nudne technikalia, że jak nie ma znanej twarzy humanistycznej, seksu, psychologii, religii, to się nikt nie zainteresuje. I historyjka wylądowała ni przypiął ni przyłatał w dodatku biznesowym.

Nie byłbym jednak sobą (a ponadto obietnice wypada choćby od czasu do czasu spełniać), gdybym się do tego czy owego w tekście Orlińskiego nie przyczepił. Bo parę rzeczy się znalazło, a cokolwiek smutne jest, że babole w sprawach okołodźwiękowocyfrowych jest w stanie wypatrzyć prosty biolog. Ciekawe, co znalazłby psychoakustyk, czy elektroakustyk.

A przy okazji, mam nadzieję, uda mi się opowiedzieć o pewnych konceptach stojących za MP3 (i nie tylko), na które nawet w porządniej napisanym artykule do DF czy biznesowego dodatku nie znalazłoby się miejsce.

Zacznijmy od drobiazgów. Pisze Orliński:

Nie miał on żadnej karty dźwiękowej, ale Brandenburg dolutował kolejnymi kabelkami tzw. przetwornik analogowo-cyfrowy, który udało mu się z kolei podłączyć do głośników.

Już na blogu WO ktoś zauważył, że w tę stronę to raczej przetwornik cyfrowo-analogowy, a ja jeszcze dorzucę, że raczej nie wprost do głośników, bo przetworniki cyfrowo-analogowe muszą być podłączone do odbiornika o wysokiej impedancji, a do takich głośnik nie należy. Musiał więc być wzmacniacz pomiędzy.

To drobiazg, idźmy jednak dalej.

Karlheinz Brandenburg, wciąż jeszcze jako doktorant, zostaje członkiem zespołu pracującego nad projektem EU-147. Jest cennym nabytkiem dla zespołu, bo jako pierwszy stawił czoła problemowi połączenia świata humanistycznego (do którego należy psychoakustyka) ze światem lutownicy i terminalu komputerowego.

Ajajaj. Gdzie humanistyka, gdzie psychoakustyka. Granice dziedzin bywają dyskusyjne, ale chyba zgodzimy się, że humanistyka bada człowieka w aspektach kulturowych, społecznych, historycznych. Psychoakustyka natomiast nie jest historyczna, nie ma dba o społeczne konteksty, bada naturę, a nie kulturę.  To dziedzina ścisła, przyrodnicza, ilościowa, to gałąź psychofizyki badająca ilościowe związki między fizycznymi parametrami dźwięków, a ich percepcją przez człowieka (i nie tylko). Nazwa nie myli, psychoakustyka stoi na pograniczu akustyki i psychologii, ale psychologii ścisłej, eksperymentalnej, tej najdalszej humanistyce. Zresztą chyba wystarczy popatrzeć na typowy artykuł psychoakustyczny, by przynależność psychoakustyki do science stała się oczywista. Pod linkiem jedna strona z Shailer MJ i Moore BCJ (1983) Gap detection as a function of frequency, bandwidth, and level. Journal of the Acoustical Society of America 74: 467-473.

Wiedziałem, że doktorat Brandenburga zakończył się w 1989 r. sukcesem – wynalezieniem systemu kodowania muzyki OCF (Optimum Coding Frequency), praprzodka MP3.

Nie, nie. OCF to skrót od Optimum Coding in the Frequency Domain – różnica niby drobna… czyżby? Przetłumaczmy.

Wersja Orlińskiego: „optymalna częstotliwość kodowania”. Czyli dokonuje się jakiegoś kodowania, z jakąś częstotliwością (ileś razy na sekundę), a doktorat Brandenburga odpowiada na pytanie jaka częstotliwość kodowania jest najlepsza.

Wersja Brandenburga: „optymalne kodowanie w dziedzinie częstotliwości”. Czyli doktorat Brandenburga odpowiada na zupełnie inne pytanie: jakie kodowanie (dokonywane w dziedzinie częstotliwości) jest najlepsze. Jednak istotna różnica, nieprawdaż?

W rozpoczynającej się obecnie dygresji spróbuję wyjaśnić pokrótce (ha, ha), o co chodzi z ową dziedziną częstotliwości. Na ile sam to, biolog w końcu prosty, rozumiem. Jak przyjdzie Andsol lub inni matematycznie sprawni, może pojawią się w komentarzach poprawki oraz załamywanie rąk nade mną, jako i ja załamuję nad Orlińskim. Zobaczymy.

Otóż rozmaici mądrzy ludzie w wieku XVIII i XIX (za wiki: babilończycy [przed XVIII wiekiem, naturalnie], Clairaut, Lagrange, Gauss, Bernoulli, Euler, i wreszcie Fourier którego nazwisko się najsilniej z tematem związało, giganci więc, na ramionach których Brandenburg stawał) obmyślili metody przedstawiania rozmaitych funkcji jako sumy prostych funkcji trygonometrycznych, sinusów i kosinusów.  Po co? Bo rozmaite obliczenia i inne zabiegi łatwiej przeprowadzić na sumie, czy złożeniu prostych funkcji, niż na jednej, za to wściekle zawiłej.

Jak takie złożenie wygląda? Na prostym przykładzie, o to dwie funkcje sinus, górna ma mniejszą częstotliwość (lata z góry na dół rzadziej), dolna ma większą częstotliwość. Górna jest większa, ma większą amplitudę (lata z góry na dół dalej od środka), dolna ma mniejszą amplitudę.

Jeżeli je ze sobą złożymy, czyli do siebie dodamy, dostaniemy coś takiego:

Spryt Fouriera i całej kompanii gigantów polegał na znalezieniu matematycznych metod rozdzielania złożonej funkcji na proste składowe, oraz pokazaniu, że każdą, nawet wściekle zawiłą funkcję, możemy rozłożyć na składowe o różnych częstotliwościach i amplitudach, o ile użyjemy tych składowych wystarczająco dużo. Oto przykład z wiki pokazujący, jak składając coraz więcej sinusów i kosinusów zbliżamy się do funkcji o kształcie prostokątnym.

Co to ma do dźwięku? Otóż dźwięk jest właśnie taką wściekle zawiłą funkcją. Dźwięk, to drgania powietrza, to malutkie i szybkie zmiany ciśnienia powietrza. Przebiegające, jak już wspomniałem, zawile. Oto przebieg zmian ciśnienia powietrza w ciągu około 25 tysięcznych sekundy, pochodzący z nagrania Sarabandy z pierwszej partity na skrzypce solo Bacha (gra Shlomo Mintz):

Narysowałem zmiany ciśnienia w czasie, skala na dole to minuty:sekundy.milisekundy nagrania. Czyli jest to sygnał przedstawiony w dziedzinie czasu. Niewiele tu można ciekawych rzeczy wypatrzeć. Ale rozłóżmy, przy pomocy przekształcenia Fouriera, powyższą zawiłość na proste trygonometryczne funkcje, na sinusy. I narysujmy sobie, jak mocne wyszły nam poszczególne sinusy.

Moglibyśmy narysować wszystkie potrzebne sinusy jeden pod drugim, tak jak to zrobiłem powyżej, pokazując dwa sinusy przed złożeniem. Nie miałoby to jednak specjalnie sensu, i to z dwóch powodów. Po pierwsze do rozłożenia zawiłej funkcji wyprodukowanej przez Mintza w ciągu 25 milisekund potrzeba okropnie wielu sinusów. Po drugie, taki obrazek pokazywałby dla każdego sinusa jego częstotliwość, amplitudę oraz kształt. A po co marnować miejsce na obrazku na kształt sinusa? Wszak jeśli się widziało jednego, widziało się wszystkie.

Narysujemy to inaczej. Na osi poziomej będą częstotliwości kolejnych sinusów, na które rozłożyliśmy Mintza. Osi pionowej użyjemy do oznaczenia, jak mocne są poszczególne sinusy, czyli jaka jest ich amplituda. Wuala:

Oto nasz fragmencik Bachowskiej partity przedstawiony w dziedzinie częstotliwości (uważny czytelnik może zauważyć, że użyłem tutaj nieco dłuższego fragmenciku niż narysowany w dziedzinie czasu, nie pokazałem też całego zakresu częstotliwości, wszystko gwoli większej czytelności).

Jakiż pożytek, zapytacie, z przerobienia dziwnych zielonych bazgrołów na dziwne różowe bazgroły? Z punktu widzenia Brandenburga ślęczącego nad doktoratem, z punktu widzenia kodowania MP3 taki, że w dziedzinie częstotliwości dalszą analizę zapisanego dźwięku, dalsze zabiegi mające na celu zmniejszenie objętości zapisu dźwięku (bo o to wszak w MP3 chodzi) przeprowadza się łatwiej, niż w dziedzinie czasu.

Ale i my możemy w wersji różowej łatwiej dostrzec pewne zjawiska niż w zielonej. Dwa najwyższe czubki czy piki naszego wykresu, te po lewej, pokazują dwa najmocniejsze sinusy, na które rozłożyl się nam nasz fragment sarabandy. Jak widać z wykresu, mają one częstotliwość około 370 Hz i około 595 Hz (Hz czyli herc oznacza raz na sekundę). Pozwala nam to powiedzieć, że w tym momencie nagrania Mintz grał jednocześnie dwie nuty, jedna struna skrzypiec wibrowała z częstotliwością 370 razy na sekundę, druga z częstotliwością 595 razy na sekundę. Popatrzmy w nuty:

Mintz gra tu pierwszy akord powyższego taktu, w tonacji h-moll, czyli powinien grać nuty h, fis’ i d”. Częstotliwości tych nut w stroju równomiernie temperowanym to odpowiednio 246,9 Hz, 370 Hz i 587,3 Hz. Biorąc pod uwagę, że na skrzypcach gra się raczej w stroju naturalnym, jak również możliwość drobnych odchyłek intonacyjnych wykonawcy oraz dokładność pomiaru, możemy uznać, że znaleźliśmy fis’ i d”. Gdzie się podziało h? Na skrzypcach normalnie da się pociągnąć smyczkiem najwyżej po dwóch strunach jednocześnie. Akordy złożone z trzech (lub czterech dźwięków) gra się zazwyczaj zaczynając od krótkiego zagrania niskiej nuty (lub dwóch niskich nut) i przeskakując natychmiast na dwie wyższe (na wyżej brzmiących strunach). Skrzypkowie mogą załamać ręce nad prostym biologiem w komentarzach. Jeśli nadal czytasz, wpisz w komentarzu słowo derkacz. Nasza analiza dotyczy momentu po przeskoczeniu, Mintz gra w tym momencie tylko dwie wyższe nuty akordu, h zagrał przed momentem, i zdążyło już zaniknąć. Nieco wcześniej, na początku akordu, dźwięk przedstawiony w dziedzinie częstotliwości wyglądał tak – h około 250 Hz widać bardzo pięknie. Wszystkie te zjawiska możemy zauważyć dzięki przedstawieniu dźwięku w dziedzinie częstotliwości, w dziedzinie czasu, na zielonym wykresie, po prostu ich nie widać.

Na tym dygresję zakończymy, a odpowiedzi nasuwające się zapewne wielu pytanie „a co to są te wszystkie pozostałe piki” udzielimy może kiedyś w innej notce.

Dygresja pokazała, mam nadzieję, czym jest reprezentacja dźwięku (czy w ogóle sygnału) w dziedzinie częstotliwości, do czego może ona służyć, a więc jak ważną część historii zgubił Orliński skracając rozwinięcie skrótu OCF.

No i ostatni fragment, nad którym mam ochotę załamywać ręce.

Od dawna było wiadomo, że ludzkie ucho nie potrzebuje całości docierającej do niego informacji. Zajmowała się tym dziedzina wiedzy zwana psychoakustyką. Wiedziałem więc, że ucho można oszukać, tak jak oszukujemy oczy, wyświetlając 25 nieruchomych obrazków – a nam się wydaje, że oglądamy ciągły film.

Podobnie działa kodowanie muzyki. Zamiast kodować całość nagrania, wystarczy kilka- lub kilkadziesiąt tysięcy razy na sekundę robić tak zwane próbkowanie, czyli zapis dźwięku w danej chwili. Czego ucho nie usłyszy, to mózg dopowie, tak jak mózg wypełnia nam brakujący ruch na taśmie filmowej.

Może ja słabo rozumiem słowo pisane, ale moim zdaniem fragment ten, w kontekście w jakim go umieszczono na drugiej stronie pierwszej części tekstu Orlińskiego, miał tłumaczyć istotę MP3, istotę kodowania, które pozwala nam zaoszczędzić wiele miejsca na naszych odtwarzaczach. Niestety, tłumaczy on zupełnie co innego, w dodatku raczej źle.

Skąd się bierze w ogóle dźwięk w postaci cyfrowej, w komputerze, na płycie CD, w pamięci odtwarzacza MP3? Jaką drogę przechodzi, od szybkich i drobnych zmian ciśnienia powietrza, do czegoś, co można zapisać celem odtworzenia po jakimś czasie?

Najpierw rys historyczny (żeby było humanistyczniej). Najprostszy zapis dźwięku można zrealizować następująco: bierzemy cienką membranę, którą drobne zmiany ciśnienia powietrza (dźwięk!) będą wprawiać w drobne ruchy. Do membrany mocujemy sztyfcik, który, poruszany przez membranę w takt zmian ciśnienia, wycina ślad w plastycznym, przesuwającym się materiale. Gdy ciśnienia chwilowo wzrasta, sztycik wsuwa się w materiał, ślad jest głębszy. Gdy ciśnienie się zmniejsza, sztyfcik się cofa, ślad jest płytszy. Potem możemy taki zapis odtworzyć w analogiczny sposób. Zmuszamy sztyfcik by podążał za wyrzeźbionym uprzednio śladem, sztyfcik wprawia w ruch membranę, membrana wprawia w ruch powietrze, i słyszymy, cośmy nagrali. Tak działały pierwsze fonografy i patefony. Przy czym w ramach postępu zmieniono kierunek ruchu sztyfcika czy igły z pionowego na poziomy.

Sztyfcik pędzący membranę miał małą skuteczność, dźwięk był słaby. Krokiem kolejnym było zaprzęgnięcie do roboty prądu elektrycznego, który nauczono się w międzyczasie wzmacniać. Zmiany ciśnienia powietrza zamieniano na zmiany prądu elektrycznego za pomocą mikrofonu, prąd z kolei mógł napędzać urządzenie nacinające rowek w płycie. Podobnie igiełka drgająca według kształtu rowka nie napędzała już wprost membrany. Za pomocą cewek i magnesów wytwarzała prąd, który następnie, po niemal dowolnym wzmocnieniu i przesłaniu na niemal dowolną odległość, napędzał membranę (pojawił się nam głośnik!), która z kolei powodowała zmiany ciśnienia powietrza, czyli dźwięk. Tak działały, i dotąd działają, gramofony.

Innym konceptem był zapis magnetyczny, najpierw na drucie stalowym, potem na taśmie papierowej pokrytej drobinkami magnetycznymi, wreszcie na taśmie z tworzywa sztucznego z magnetyczną powłoką. Prąd z mikrofonu po wzmocnieniu wytwarzał pole magnetyczne, które ustawiało kierunek namagnesowania na przesuwającej się taśmie. A potem przesuwająca się namagensowana taśma generowała w odpowiednim urządzeniu prąd elektryczny (pamiętacie ze szkoły: indukcja, reguły różnych rąk, te sprawy), który po wzmocnieniu ruszał membraną głośnika. Tak działały (czas przeszły praktycznie usprawiedliwony) magnetofony.

Wszystkie powyższe metody zapisu są analogowe. Na każdym etapie istnieje prosta odpowiedniość między dźwiękiem, czyli przebiegiem zmian ciśnienia powietrza, a jakąś fizyczną wielkością. Gdy ciśnienie jest większe, rowek jest głębszy lub przesunięty bardziej w jedną stronę, napięcie elektryczne wyższe, ustawienie cząsteczek magnetycznych bardziej w którąś stronę. Gdy ciśnienie jest mniejsze, prąd płynie w drugą stronę, rowek jest płytszy, cząstki magnetyczne ustawione inaczej. Zapis jest analogowy i ciągły, nieprzerwany – dla każdego wyobrażalnego momentu w czasie rowek gdzieś się znajduje, napięcie elektryczne ma jakąś wartość. Gdzieś tam pod spodem są oczywiście nieciągłe atomy i elektrony, podobnie jak naprawdę nieciągłe jest ciśnienie powietrza, biorące się z uderzeń pojedynczych cząsteczek gazów – ale dzieje się to w tak drobnej skali, że możemy w praktyce mówić o ciągłości.

Ta odpowiedniość, analogiczność zapisu z dźwiękiem została zerwana w zapisie cyfrowym. Polega on na próbkowaniu, czyli na mierzeniu i notowaniu wartości tego, co mierzymy, w pewnych, równych odstępach czasu. Innymi słowy z pewną częstotliwością, zwaną częstotliwością próbkowania. W przypadku dźwięku mierzymy ciśnienie powietrza, a tak naprawdę, jak zwykle w naszej elektrocentrycznej cywilizacji, mierzymy napięcie wyprodukowane przez mikrofon, napięcie, którego przebieg odpowiada przebiegowi ciśnienia powietrza. Czytających proszę o wpisanie do komentarza słowa dyrdymały. Wynik pomiaru, ciąg zapisanych liczb, w żaden sposób fizycznie nie odpowiada przebiegowi dźwięku. Jest tylko jego abstrakcyjną reprezentacją. Jest jego liczbowym opisem. Który możemy przetworzyć w inny, równie abstrakcyjny opis, nie tracąc nic z informacji (na przykład 3952 → MMMCMLII → 0x0F70 → dreitausendneunhundertzweiundfünfzig). Co więcej, zapis jest nieciągły, inaczej mówiąc dyskretny, wartości istnieją tylko dla momentów, w których zostały zmierzone, między nimi nic nie ma. Nic a nic.

I jeszcze jedno – ponieważ zapis cyfrowy nie odpowiada fizycznie dźwiękowi, procesu odtwarzania dźwięku zapisanego cyfrowo w zasadzie nie powinien nazywać się odtwarzaniem. Odpowiednie urządzenie, jak pamiętamy dzięki Orlińskiemu poprawiającemu Orlińskiego komentatorowi na jego blogu, zwane przetwornikiem cyfrowo-analogowym, tak naprawdę na podstawie liczbowego opisu na nowo wytwarza dźwięk napięcie elektryczne, następnie przetwarzane poprzez wzmacniacz i głośnik na dźwięk.

No dobrze, zapytacie, ależ czyż nie toż samoż o próbkowaniu napisałże Orliński? Plus minus to samo. To czemu się go czepiasz? Z dwóch powodów.

Po pierwsze, nie jest prawdą, że z powodu nieciągłości próbkowania „czego ucho nie usłyszy, to mózg dopowie”. Dzięki kolejnej porcji gigantów (Whittaker, Kotielnikow, Nyquist, Shannon) mamy twierdzenie o próbkowaniu, zwane często twierdzeniem Nyquista-Shannona (lub inną kombinacją gigancich nazwisk). Twierdzenie to mówi nam (w wersji udelfinionej na nasze potrzeby), że sygnał zawierający składowe (znów Fourier się kłania) o częstotliwościach nie większych niż B może zostać wiernie zapisany za pomocą próbkowania z częstotliwością próbkowania 2B.  Wiernie – czyli mózg nic nie musi dopowiadać, mimo próbkowania, mimo że między momentami pomiaru nic nie ma, informacja jest wystarczająca do pełnego odtworzenia sygnału. Czyli w naszym przypadku, dźwięku.

Jeśli kiedykolwiek, powodowani niezdrową ciekawością, zaglądaliście w właściwości plików dźwiękowych na waszym komputerze (raczej za pomocą programów do obróbki dźwięku, sam system niechętnie pokazuje takie technikalia), może zauważyliście, że częstotliwość próbkowania wynosi często 44100 Hz. Taką częstotliwość próbkowania przyjęto dla płyt CD, z których wszak wiele plików dźwiękowych pośrednio czy bezpośrednio pochodzi. Jak wynika z twierdzenia o próbkowaniu, częstotliwość próbkowania 44100 kHz zapewnia zapis składowych dźwięku o częstotliwościach od 0 do 22050 Hz. Jako że ludzie słyszą dźwięki o częstotliwościach w porywach do 20000 Hz (i to raczej dzieciątka niewinne, w wieku dojrzalszym częściej spotkamy granicę 16000 Hz, czy coś koło tego), częstotliwość próbkowania przyjęta dla CD wystarcza z zapasikiem, by zapisać i odtworzyć słyszalne dla człowieka dźwięki. (O modzie na supertweetery oraz częstotliwości próbkowania 96 i 192 kHz, jak i o niespodziewanych beneficjentach tej mody, pogadamy innym razem).

Inne informacje, jakie niezdrowy ciekawski może wyczytać we właściwościach plików dźwiękowych, to mono/stereo (wiemy o co chodzi, prawda?) oraz liczba bitów. Liczba bitów, w dzisiejszych czasach występująca niemal wyłącznie jako 16, rzadko 24 lub 32, historycznie 8, mówi nam o kolejnym praktycznym ograniczeniu zapisu cyfrowego. Związane jest ono z tak zwaną kwantyzacją. Chwilę o tym pomówimy, później się przyda. Otóż, gdy w czasie próbkowania mierzymy nasz sygnał, każdy wynik pomiaru musimy gdzieś zapisać, jako liczbę w komórce pamięci komputera, czy innego rejestratora. Komórki te mają pewną wielkość, mierzoną w tych właśnie tajemniczych bitach. Jeżeli bitów jest 8, liczba wynikająca z pomiaru może mieć jedną z 256 wartości (najczęstsza konwencja to 0 do 255, bez ułamków). Gdy bitów jest 16, wartości jest 65536 (typowa konwencja tym razem to -32768 do 32767), i tak dalej.

Z liczby bitów wynika możliwa do uzyskania dynamika sygnału. Uch, kolejne dziwne słowo. W dodatku dynamika, o której mowa, nie ma nic wspólnego z potocznym znaczeniem słowa dynamiczny. Dynamika mówi nam, jaka jest możliwa rozpiętość głośności dźwięków (ogólnie sygnałów). Inaczej mówiąc, o ile najgłośniejsze „mieszczące się” dźwięki są głośniejsze od najcichszych, jakie da się zapisać. Dlaczego to ważne? Bo muzyka się składa z dźwięków cichych i głośnych, a chcemy zapisać je wszystkie! Ot, na przykład patrzę sobie teraz na nagranie IX symfonii Beethovena, gdzie najcichsze dźwięki są o jakieś 60 decybeli (dB) cichsze od nagłośniejszych. Ile bitów nam potrzeba? To się da policzyć.

Spróbujmy z ośmioma bitami. Najgłośniejszy sygnał jaki możemy zapisać używając 8 bitów, t0 sygnał rozciągający się na 256 jednostek, od 0 do 255. Najcichszy, to taki, który drga tylko między dwoma sąsiednimi wartościami, np 127 i 128. Amplituda pierwszego to 256 jednostek, drugiego – jedna jednostka. Na decybele to będzie 20*log10(256/1)≈48 dB (co to jest decybel, dlaczego nie jest to po prostu jednostka natężenia dźwięku, dlaczego czasem we wzorze jest 20 a czasem 10, i dlaczego decybele mogą być ujemne, opowiemy sobie innym razem). To już chyba wiemy, czemu zapis dźwięku w 8 bitach ma znaczenie historyczne.  Skutkiem tak małej dynamiki jest wyraźnie słyszalny szum (szum kwantyzacji), w którym giną cichsze fragmenty muzyki.

Weźmy 16 bitów: 20*log(65536/1)≈96 dB, czyli pięknie starcza na zapisanie Beethovena. I to jest właśnie najczęściej używana wartość, i jednocześnie wartość, jakiej używają płyty CD. O tym czy i po co warto używać 24 czy 32 bitów, też innym razem. Na zakończenie tego fragmentu poproszę o zapamiętanie, że zapisywalna dynamika zależy od liczby bitów, że gdy jest ich mało to będzie słychać szum kwantyzacji (ale plik zajmie mniej miejsca). I dodam dla porównania z CD, że dynamika najwyższej klasy gramofonów czy domowych magnetofonów oceniana jest na około 70 dB. I jeszcze, że tak działa próbkowanie metodą liniowej modulacji impulsowo-kodowej (LPCM), używaną w komputerach, odtwarzaczach CD, DVD. Z domowych urządzeń inną metodą (zwaną DSD) posługują się odtwarzacze SACD, dość powiedzieć, że używają zapisu jednobitowego, za to z częstotliwością ponad 2800 kHz.

A jaki jeszcze błąd popełnił Orliński w ostatnim fragmencie, poza twierdzeniem, że mózg coś musi dopowiadać? Taki mianowicie, że próbkowanie, o którym opowiedział, a o którym ja opowiedziałem nieco więcej, nie jest istotą MP3, nie jest istotą dokonań Brandenburga. Samym próbkowaniem doszliśmy na razie do płyty CD, do cyfrowego dźwięku nieskompresowanego. Tam, gdzie Orliński zakończył swój opis, MP3 dopiero się tu zaczyna.

Po co w ogóle MP3? Po to, że nieskompresowany dźwięk zajmuje dużo miejsca – w pamięci, na dysku, w kabelkach internetu. Jedna minuta zapisana z parametrami takimi, jak na płycie CD, to około 10 MB (44100 próbek na sekundę, razy dwa bajty (16 bitów), razy dwa kanały (stereo), razy 60 sekund, proszę sobie policzyć). Pamiętam pierwsze twarde dyski do pecetów, cały dysk miał 10 MB. Dziś szybkość zapisu dźwięku cyfrowego często podajemy jako przepływność (kocham to słowo), z angielska bitrate, w kilobitach na sekundę (kbps). Muzyka na CD to prawie 1400 kbps. Z internetem łączono się kiedyś przez modemy telefoniczne osiągające 56 kbps, mój pierwszy „szerokopasmowy” internet miał bodajże 768 kbps. Widać w czym był problem, prawda?

Trzeba było te pliki dźwiękowe jakoś zmniejszyć, skompresować. Ludzie wiekowi jak ja zapewne pamiętają programiki pod DOS o nazwach pkzip i pkunzip, pierwsze programy do kompresowania i rozkompresowania plików używaną do dzisiaj metodą (czy grupą metod) ZIP. Dlaczego nie użyć tej metody do kompresowania dźwięku? Cóż, typowe metody kompresowania polegają na technikach takich, jak wynajdywanie w kompresowanych plikach powtarzających się fragmentów. W cyfrowym dźwięku takie fragmenty występują bardzo rzadko. I użycie zwykłych metod kompresji rzadko zmniejsza pliki dźwiękowe więcej niż o 10%. Zmniejszenie objętości minuty muzyki z 10MB do 9MB to wątpliwej klasy osiągnięcie.

Pewien postęp nastąpił po wynalezieniu metod kompresji specjalnie zaprojektowanych do muzyki. Korzystały one na przykład z faktu, że typowe pliki muzyczne są plikami stereo, a informacja w kanale lewym jest zazwyczaj podobna do informacji w kanale prawym. Mój pierwszy kontakt z takimi metodami kompresji to rosyjski program do kompresji RAR, który wprowadził „Multimedia compression”. Zdarzało się uzyskać 50% zmniejszenie wielkości pliku. Łał. Po wielu latach w zasadzie nie umiemy zrobić tego znacząco lepiej, współczesne algorytmy kompresji bezstratnej dźwięku (FLAC, Monkey Audio, WMA Lossless czy ALAC) zazwyczaj osiągają około 50-60%. Rzut oka na moje zbiory we FLAC pokazał wartości od 450 do 900 kbps, najtrudniej (nadal, jak za Brandenburga) kompresuje się klawesyn solo. Suzanne Vega nie posiadam. Postęp od RAR dokonał się bardziej na polu dostosowania formatów do specyfiki odtwarzania muzyki – możliwość dekompresji „w locie”, w trakcie odczytywania pliku, czy dopisania „tagów” opisujących utwór muzyczny, niż w stopniu skompresowania.

Zmniejszenie minuty muzyki z 10 do 5 MB, z 1400 do 700 kbps, to ciągle niezbyt dużo, i z pewnością nie byłoby to wystarczające, w czasach, gdy Brandenburg zaczynał doktorat, przy wielkościach dysków wówczas używanych. „Byłoby”, bo wtedy FLACów i ALACów jeszcze nie było, to historia XXI wieku. A nawet gdyby były, ówczesne komputery nie udźwignęłyby ich obliczeniowo. Pamiętajmy też, że skompresowany plik dźwiękowy trzeba rozpakowywać wystarczająco szybko, by nadążyć za muzyką. Zapuszczenie na noc rozkompresowania czterominutowej piosenki po to, by jej rano przez cztery minuty posłuchać, nie jest fajne. Trzeba więc było wymyśleć coś innego.

I tu na scenę wkracza Brandenburg, Optimal Coding in the Frequency domain, i giganci psychoakustyki. Którzy zajmowali się między innymi zjawiskiem maskowania. Polegającym z grubsza na tym, że jeden dźwięk może zagłuszyć inny. Niby banalna obserwacja, ale skrupulatne pomiary, jakie muszą być relacje między dźwiękami, by nastąpiło maskowanie, przyniosły wiedzę o funkcjonowaniu ludzkiego ucha (punkt wyjścia do guglania: pasma/wstęgi krytyczne, critical bands), i pomogły Brandenburgowi. Wiemy na przykład, że dźwięki głośne szczególnie dobrze maskują dźwięki o podobnych częstotliwościach, a słabiej dźwięki o odległych częstotliwościach. Wiemy, że maskowanie może też dotyczyć dźwięków niejednoczesnych. Wiemy, też że dźwięki bardzo niskie a ciche, jak i bardzo wysokie a ciche, w ogóle nie są słyszalne. Za to składowe o częstotliwościach około 1-4 kHz słyszymy wyjątkowo dobrze. Dużo tego typu rzeczy wiemy.

Taka wiedza psychoakustyczna pozwoliła na zaprojektowanie kompresji stratnej dźwięku. Użyłem tu słowa „stratna”, trzy akapity wyżej wspomniałem o kompresji „bezstratnej”, najwyższa pora wyjaśnić, o co idzie. Kompresja bezstratna to taka, której wynikiem (a raczej wynikiem pary kompresja-a-następnie-dekompresja) jest informacja dokładnie identyczna z informacją, która była kompresowana. Nie ma żadnej różnicy. Tak działa ZIP, tak działa FLAC czy ALAC. Natomiast wynikiem kompresji-a-następnie-dekompresji stratnej jest informacja inna od informacji początkowej. Obrazek po kompresji JPEG różni się ciut od obrazka przed kompresją. Plik dźwiękowy uzyskany po dekompresji MP3, Vorbis, AAC czy WMA różni się nieco od tego, który został skompresowany.  Coś zostało zmienione, wyrzucone, stracone. Stratę tę równoważy jednak zysk w możliwym do uzyskania stopniu kompresji. Pamiętamy, na płycie CD mamy 1400 kbps, kompresją bezstratną możemy to zmniejszyć do 500-700 kbps. Kompresja stratna może więcej, choć im niższa wartość kbps, tym większa szansa usłyszenia niekoniecznie przyjemnej różnicy od oryginału. Pliki MP3 128 kbps (ponad 10-krotnie mniejsze od oryginału CD!) zazwyczaj dają się nieźle słuchać. 192 kbps – mało kto odróżni od CD. 256, 320 kbps – chyba nikomu nigdy nie udało się odróżnić, w każdym razie przy słuchaniu muzyki, a nie specjalnie spreparowanych sygnałów. A miejmy na uwadze, że formaty nowocześniejsze niż MP3 (AAC, Vorbis) zazwyczaj radzą sobie jeszcze lepiej.

Jak to działa, co się dzieje od momentu, w którym Orliński porzucił nasz zakodowany cyfrowo, ale wcale jeszcze nie skompresowany dźwięk? Pisząc w przybliżeniu (czekam na specjalistów od MP3, co załamią nad prostym biologiem ręce): cyfrowy dźwięk jest dzielony na krótkie odcinki. Każdy odcinek jest rozkładany na składowe o różnych częstotliwościach przy pomocy cyfrowych filtrów. Każda składowa jest analizowana (pamiętacie jeszcze Fouriera? – jeśli tak, wpiszcie słowo degrengolada do komentarza) za pomocą przekształcenia pokrewnego przekształceniu Fouriera. Następnie przy pomocy modelu psychoakustycznego oceniana jest słyszalność poszczególnych składowych, czy to z racji znajdowania się poza pasmem słyszalności (za niskie/wysokie i jednocześnie za ciche by ktokolwiek je usłyszał), czy to z racji maskowania przez inne dźwięki. Można to porównać do dobierania liczby bitów użytej to zakodowania poszczególnych składowych tak, aby szum kwantyzacji (pamiętacie?) był jak największy (jak najmniej bitów), ale nadal niesłyszalny – bo zamaskowany przez inne dźwięki. Stosowane są też inne mechanizmy, na przykład algorytm może skorzystać z podobieństwa lewego i prawego kanału. Na koniec cała opracowana, pozbawiona niesłyszalnych (oby) składowych, informacja o dźwięku jest dodatkowo kompresowana metodą bezstratną, i mamy śliczną paczuszkę dźwiękową, rozmiaru 10-20% oryginału, gotową do odtworzenia, i zajmującą wygodnie niewiele miejsca na dysku czy w pamięci odtwarzacza mp3.

Pozdrowienia dla tych, którzy dotarli ze mną do końca!

Reklamy

106 responses to “O dźwięku cyfrowanym

  1. niedofizyk 5.8.2011, piątek o 0:54:19

    100% racji, nie widzę mankamentów. Dorzucę trzy grosze:
    1) pozostałe piki na wykresie to głównie harmoniczne, które ładnie widać, jeśli oś f pozostawić w skali liniowej (równe odstępy).
    2) ludzkie ucho robi coś w stylu transformaty Fouriera (różne komórki łapią różne częstości), przy czym rozróżnia częstość i głośność, ale nie fazę (co dość istotne przy konstrukcji sprzętu, nawet analogowego – mało które głośniki wielodrożne zachowują fazę)

  2. Nowaczek 5.8.2011, piątek o 2:52:54

    degrengolada :)

  3. miasto-masa-maszyna 5.8.2011, piątek o 3:29:43

    @OCF
    @Tam, gdzie Orliński zakończył swój opis, MP3 dopiero się tu zaczyna.

    Mi to wygląda na spójność niekompetencji. Tzn. on chyba naprawdę myśli, że trick z mp3 polega na odpowiednim próbkowaniu. A Brandenburg wymyślił jak częstotliwość tego próbkowania optymalnie dobrać (optimal coding frequency), czyli wynalazł prawo Kotielnikowa-Shannona 50 lat po nich ;-)

    A jeśli chodzi o olbrzymów, na których barkach stoi wynalazek mp3, to trzeba wspomnieć jeszcze o szybkiej transformacie Fouriera (FFT), czyli algorytmowi, który pomaga na wydajne liczenie tejże dla przebiegów dyskretnych, w dodatku o ograniczonym zakresie wartości, czyli dokładnie takich z jakimi mamy do czynienia w cyfrowym sygnale muzycznym albo obrazie (2^n bitów). Bez FFT nie mielibyśmy nie tylko mp3 ale także wszystkich współczesnych technik obróbki obrazu i dźwięku (np. autotune).

    PS: Zobaczymy czy się sprawdzi to, co Ci napisałem na GTalku ;-)

  4. janekr 5.8.2011, piątek o 4:00:47

    derkacz!
    „Na osi poziomej będą częstotliwości kolejnych sinusów, na które rozłożyliśmy Mintza. Osi pionowej użyjemy do oznaczenia, jak mocne są poszczególne sinusy, czyli jaka jest ich amplituda.”

    No i jednak pominąłeś fazę. Na temat tego, czy przesunięcia fazowe są słyszalne, stoczono liczne wojny. Zdaje się, że faktycznie nieszczególnie, niemniej jednak – nawet w tak uproszczonym tekście – nie można ot tak sobie fazy a priori pomijać.

  5. miasto-masa-maszyna 5.8.2011, piątek o 4:57:32

    Jedziemy dalej:

    Mimo swojej nowoczesności na zakodowanie dwudziestu sekund muzyki komputer Hewletta-Packarda potrzebował czterech godzin. Gdy dziś zrzucam płytę kompaktową na swojego laptopa, dokonuje kodowania z szybkością „dziesięciokrotną” – to znaczy, że 60 sekund muzyki to 6 sekund kodowania.

    Mój pracowy Mac Mini koduje WAV do dobrej jakości MP3 z prędkością trzydziestokrotną. Nie sądzę by WO miał sprzęt o tyle wolniejszy. Raczej jego x10 to prędkość ripowania z CD oraz kodowania.

  6. miasto-masa-maszyna 5.8.2011, piątek o 5:23:42

    Ponieważ miał to być element standardu składającego się z trzech „warstw” („layers”), nazwaliśmy to MPEG Layer 3…

    To też nie do końca prawda. Trójka w nazwie nie pochodzi od trzech warstw standardu MPEG, tylko od trzech różnych algorytmów (o różnym stopniu skomplikowania) którymi można kodować jedną z tych warstw: MPEG Audio Layer I, MPEG Audio Layer II i MPEG Audio Layer III – czyli nasze mp3.

  7. miasto-masa-maszyna 5.8.2011, piątek o 5:41:50

    Konsorcjum MPEG przyjęło trójwarstwowy standard kodowania dźwięku. Warstwa druga (MPEG Layer 2) do dzisiaj wykorzystywana jest m.in. we wspomnianym radiu cyfrowym DAB.

    I dalej ten sam błąd. Trójwarstwowo to jest w MPEG kodowane wideo a nie muzyka. „MPEG Audio Layer II” to drugi algorytm kodowania warstwy audio a nie druga warstwa. Audio jest w standardzie MPEG warstwą trzecią, niezależnie czy zostanie zakodowane algorytmem I, II czy III.

  8. miasto-masa-maszyna 5.8.2011, piątek o 5:55:51

    Zresztą, owe warstwy (layers) to przenośne określenie części standardu MPEG (czyli po prostu „rozdziały” specyfikacji) a nie rzeczywistego strumienia audiovideo. Warstwa pierwsza to definicje software’owo hardware’owe. Druga – algorytmy kodowania wideo. Trzecia – algorytmy kodowania audio.

    No. To chyba tyle.

  9. wo 5.8.2011, piątek o 7:20:56

    Po pierwsze: Derkacz!

    A po drugie:
    @m3
    „Tzn. on chyba naprawdę myśli, że trick z mp3 polega na odpowiednim próbkowaniu”

    Twoja stara tak myśli. Tekst w ogóle nie był próbą wyjaśnienia, „jak to działa”. Zainteresowani to sobie, na litość boską, mogą sprawdzić w byle wikipedii. Tekst był próbą opisania, kim są ci ludzie, co nimi motywuje, dlaczego (niezgodnie ze wzorcami karier, które wciąż jeszcze uważa się za idealne w 3RP) nie odeszli, by zakładać własne firmy itd. Był wskazaniem Generałowi Publicznemu, że MP3 nie wymyślili ani Steve Jobs ani Bill Gates. A poza tym oczywiście zgoda, nie cyfrowo-analogowy tylko analogowo-cyfrowy.

    Z mnóstwa technicznych ciekawostek, które usłyszałem od Brandenburga – a na które nie było miejsca w tym tekście – najbardziej zafascynowało mnie coś, co badacze roboczo nazywali „dźwiękowym Heisenbergiem”. Przy okazji OCF okazało się, że im dokładniej się odtworzy barwę dźwięku, tym trudniej złapać rytm i odwrotnie. Ten problem rozwiązano dopiero w MP3 przez zmienną częstotliwość próbkowania. Algorytm wstępnie skanuje plik do kompresji i ustala, gdzie dbać głównie o rytm, a gdzie o barwę. Stąd właśnie problem z kodowaniem muzyki pop. Ciekawe! Ale do innego tekstu.

    @m3
    „Trójka w nazwie nie pochodzi od trzech warstw standardu MPEG, tylko od trzech różnych algorytmów (o różnym stopniu skomplikowania) którymi można kodować jedną z tych warstw: MPEG Audio Layer I, MPEG Audio Layer II i MPEG Audio Layer III – czyli nasze mp3.”

    A te trzy różne algorytmy to są trzy warstwy standardu. To już czepnięcie wyjątkowo idiotyczne.

  10. miasto-masa-maszyna 5.8.2011, piątek o 7:28:57

    @wo
    Tekst w ogóle nie był próbą wyjaśnienia, „jak to działa”.

    A jednak poświęciłeś w nim miejsce na wyjaśnienie jak działa… Audio CD.

    Z mnóstwa technicznych ciekawostek, które usłyszałem od Brandenburga – a na które nie było miejsca w tym tekście – najbardziej zafascynowało mnie coś, co badacze roboczo nazywali „dźwiękowym Heisenbergiem”. Przy okazji OCF okazało się, że im dokładniej się odtworzy barwę dźwięku, tym trudniej złapać rytm i odwrotnie.

    No tak, problemy z fazą.

    A te trzy różne algorytmy to są trzy warstwy standardu.

    No właśnie nie. Trzy warstwy standardu to:
    1. specyfikacje hardwarowo-software’owe
    2. kodeki video
    3. kodeki audio

  11. niedofizyk 5.8.2011, piątek o 7:34:56

    @wo
    Ten problem rozwiązano dopiero w MP3 przez zmienną częstotliwość próbkowania.
    nie ma zmiennej częstotliwości próbkowania. może być zmienna długość ramek FFT co najwyżej.

  12. wo 5.8.2011, piątek o 7:41:03

    @mp3
    „A jednak poświęciłeś w nim miejsce na wyjaśnienie jak działa… Audio CD.”

    Tam nawet chyba jest parę zdań o tym, jak dojechać z Ilmenau do Erlangen. Chociaż – uprzedzając kolejny zarzut – jako przewodnik turystyczny po Niemczech sprawdza się to słabo.

    „No właśnie nie. ”

    No właśnie tak. Trzy warstwy tego standardu to MPEG Layer 1, MPEG Layer 2 i MPEG Layer 3.

  13. miasto-masa-maszyna 5.8.2011, piątek o 7:47:37

    @wo
    No właśnie tak. Trzy warstwy tego standardu to MPEG Layer 1, MPEG Layer 2 i MPEG Layer 3.

    Trzeci raz nie będę Ci powtarzał w którym miejscu się mylisz. Po prosytu doczytaj sobie.

  14. wo 5.8.2011, piątek o 8:05:04

    @m3
    „Trzeci raz nie będę Ci powtarzał w którym miejscu się mylisz. ”

    Gdyby tu był błąd rzeczywisty, a nie urojony, to byś go wskazał jednoznacznie. A napisałeś tylko, że wartstwy nie mogą być algorytmami, bo zabrania tego Unijna Norma Do Spraw Algorytmów.

  15. miasto-masa-maszyna 5.8.2011, piątek o 8:16:15

    Oczywiście jako człowiek piszący o tym półhobbystycznie dla kompletnych laików możesz to nazywać Zuzanną. Co do tego nie ma między nami sporu.

  16. miskidomleka 5.8.2011, piątek o 11:23:45

    @niedofizyk
    Pewnie, że harmoniczne. To między innymi dzięki nim słychać, że Mintz gra na skrzypcach a nie na oboju.
    Co do „transformaty Fouriera w uchu” to z racji rozmaitych różnic wielu uważa to porównanie za szkodliwe.

    @3m
    to trzeba wspomnieć jeszcze o szybkiej transformacie Fouriera (FFT), czyli algorytmowi, który pomaga na wydajne liczenie tejże dla przebiegów dyskretnych,

    Ho ho, o czym jeszcze trzeba by wspomnieć… Najpierw rozróżnienie przekształcenia dla ciągłych i dla dyskretnych, potem FFT, a potem wytłumaczyć czym różni się MDCT jakie stosował Brandenburg. Nie podejmuję się. Starałem się lawirować między Scyllą dokładności i Charybdą przystępności.
    Ale FFT bardzo ważne. Za przekształceniem zielonych w różowe oczywiście stało FFT, co gdzieś tam nawet można wypatrzeć na obrazku.

    @janekr
    Tak, pominąłem fazę. Uznałem, że ponieważ jest (lub chyba jest) niesłyszalna, trudno jest wytłumaczyć przystępnie i obrazowo o co w niej chodzi – i że nic to nie wniesie do notki (która i tak wyszła jakby przydługa).

    @wo
    Z mnóstwa technicznych ciekawostek, które usłyszałem od Brandenburga – a na które nie było miejsca w tym tekście – najbardziej zafascynowało mnie coś, co badacze roboczo nazywali „dźwiękowym Heisenbergiem”.

    Rozumiem, że chodzi o użycie krótkich ramek w przypadku wykrycia transjentu, poświęcając lokalnie dokładność w osi częstotliwości na rzecz dokładności w osi czasu?
    Oczywiście zasada nieoznaczoności w tym kontekście (albo małe f, albo małe t) nie jest niczym nowym ani wynalazkiem Brandenburga, nie przyłożyłem się do śledzenia kiedy się to zaczęło, ale szybki gugiel wyrzucił odniesienia z czasów kiedy Brandenburg dopiero przestał mówić na muchy tapty N.G. de Bruijn, „Uncertainty principles in Fourier analysis” O. Shisha (ed.) , Inequalities , Acad. Press (1967) pp. 55–71, coś też widziałem z 1933.
    Nie wiedziałem jednak, że już w MP3 (czy nawet OCF) stosowano taki zabieg.
    Inna rzecz, która mnie zaskoczyła w MP3, to „bit reservoir”, czyli nawet CBR może być nieco VBR.

    Tam nawet chyba jest parę zdań o tym, jak dojechać z Ilmenau do Erlangen

    Wykręcasz się zupełnie jak Orliński (oh, wait). Napisałeś kawałek „jak to działa”, w którym napisałeś (z istotnym błędem) jak działa co innego.

  17. wo 5.8.2011, piątek o 13:22:36

    @miskidomleka
    „Rozumiem, że chodzi o użycie krótkich ramek w przypadku wykrycia transjentu, poświęcając lokalnie dokładność w osi częstotliwości na rzecz dokładności w osi czasu?”

    Nie pytałem.

    „Oczywiście zasada nieoznaczoności w tym kontekście (albo małe f, albo małe t) nie jest niczym nowym ani wynalazkiem Brandenburga,”

    Nie mówię, że nowym – mówię, że mnie to zaciekawiło.

    „Napisałeś kawałek „jak to działa”, w którym napisałeś (z istotnym błędem) jak działa co innego.”

    Napisałem też, jak jechałem z Ilmenau do Erlangen. A gdyby błąd był „istotny”, to byś nie pisał „Plus minus to samo”. Jeśli „plus minus to samo”, to znaczy, że błąd jest zaniedbywalny.

  18. leslieFH 5.8.2011, piątek o 13:28:56

    derkacz, dyrdymały, degrengolada. Zadowolony? :-)

  19. miskidomleka 5.8.2011, piątek o 15:53:53

    @wo

    Jej, ciągle nie rozumiesz? Jak działa próbkowanie, napisałeś dość dobrze. Plus minus to samo co ja, tylko oczywiście z większymi skrótami.

    Tylko zrobiłeś dwa poważne błędy.

    Pierwszy, to przegapienie twierdzenia o próbkowaniu:
    „If a function x(t) contains no frequencies higher than B hertz, it is completely determined by giving its ordinates at a series of points spaced 1/(2B) seconds apart.”
    więc nie ma żadnej potrzeby dopowiadania przez mózg, i nie wynika to z psychoakustyki. I, wbrew temu co napisałeś, próbkowanie jest kodowaniem całości nagrania – oczywiście w paśmie do częstotliwości Nyquista, i z zastrzeżeniem rozdzielczości bitowej i błędu kwantyzacji.

    Drugi – przedstawiłeś dyskretność próbkowania tak, jakby ona odpowiadała za główna zaletę funkcjonalną MP3 i pokrewnych formatów, czyli za stosunkowo małą przepływność przy zachowaniu akceptowalnej jakości dźwięku.
    I jest to nieprawda, bo próbkowanie dla CD i dla MP3 jest identyczne. Istota MP3 zaczyna się po próbkowaniu, kiedy model psychoakustyczny jest zastosowany do zaoszczędzenia bitów – przez „odrzucanie” (cudzysłów bardzo ważny) informacji, które zgodnie z modelem nie są słyszalne, z powodu maskowania lub z powodu znajdowania się poniżej progu słyszalności.

    @leslieFH

    Wreszcie jeden który przeczytał ;-)

  20. fizyk 5.8.2011, piątek o 16:51:46

    @wo

    Zasada nieoznaczoności Heisenberga to czysty fakt matematyczny wynikający z własności fal. Taka prosta konsekwencja nierówności Schwarza i nierówności trójkąta. :-)

  21. Magdalaena 5.8.2011, piątek o 17:10:09

    Proszę bardzo – derkacz, dyrdymały, degrengolada.
    Łapałam sens wypowiedzi prawie do końca. Ale i tak tekst Orlińskiego był zabawniejszy w czytaniu. I oddawał sens problemu – tj. porównanie taśmy filmowej do mp3.

  22. miastomasamaszyna 5.8.2011, piątek o 17:23:35

    I oddawał sens problemu – tj. porównanie taśmy filmowej do mp3.

    O to właśnie chodzi, że w ogóle nie.

  23. wo 5.8.2011, piątek o 17:58:08

    @miskidomleka
    „Tylko zrobiłeś dwa poważne błędy. Pierwszy, to przegapienie twierdzenia o próbkowaniu:”

    A więc nie „zrobiłem błędy”, tylko odpuściłem sobie wdawanie się w szczegóły, które zainteresowani sobie mogą znaleźć w byle wikipedii, żeby więcej miejsca było na to, co naprawdę ciekawe.

  24. miskidomleka 5.8.2011, piątek o 18:41:46

    Nie. Jako sposób dzięki któremu mp3 zajmuje mniej miejsca niż dźwięk nieskompresowany podałeś nieciągłość próbkowania, co jest nieprawdą, a nie niewdawaniem się w szczegóły.

    Zwróć uwagę, że nie napisałem „powinieneś był podać twierdzenie o próbkowaniu” tylko, że je przegapiłeś. I napisałeś sprzeczną z nim nieprawdę.

    Tak naprawdę, jakbyś chciał zaoszczędzić miejsce, mógłbyś odpuścić w ogóle opis próbkowania, on nie jest potrzebny do złapania idei stratnej kompresji audio.

    Można było napisać coś w guście „Podczas kodowania mp3 muzyka jest analizowana i odrzucane są te dźwięki, których, jak wiemy z lat badań psychoakustycznych, ucho i tak nie jest w stanie usłyszeć. Na przykład dlatego, że są zagłuszane (fachowcy mówią: „maskowane”) przez inne dźwięki.”

    Pewnie, że są tu uproszczenia, ale koncept jest przekazany. A Ty napisałeś nieprawdę, która, jak widać po komentarzu Magdalaeny, okazała się chwytliwa.

  25. wo 6.8.2011, sobota o 5:40:14

    @miskidomleka
    „Jako sposób dzięki któremu mp3 zajmuje mniej miejsca niż dźwięk nieskompresowany podałeś nieciągłość próbkowania, co jest nieprawdą, a nie niewdawaniem się w szczegóły.”

    Nie. Napisałem, że od tego zaczynamy, nie wnikając w to, co z tymi danymi robimy później (przecież skoro są różne algorytmy to jasne, że są różne sposoby dalszej obróbki tego, co sobie spróbkowaliśmy).

    „Zwróć uwagę, że nie napisałem „powinieneś był podać twierdzenie o próbkowaniu” tylko, że je przegapiłeś.”

    Ależ ja się zgadzam, że to co napisałeś jest pełne błędów, przeinaczeń i nieścisłości! Może kiedyś napiszę o tym notkę. Rzeczywiście, wyraziłeś się niezręcznie – rzetelność wymagałaby właśnie, żebyś napisał to mniej więcej tak, „bardzo mi przykro, ze za mało tu było o kosinusach, Fourierze i wewogle, jakiś fajny wzorek matematyczn by dobrze zrobił”.

    „Pewnie, że są tu uproszczenia, ale koncept jest przekazany.”

    Ygzaktly – Ty byś chciał przeczytać przedruk hasła z Wiki pt. „na czym polega koncept”. A ja nie.

  26. mom 6.8.2011, sobota o 6:45:33

    @wo:
    nie mozesz po prostu napisac ‚jestem dziennikarzem i pisze artykul w dziedzinie o ktorej nie mam zielonego pojecia. wzelkich melomanow, fizykow i zainteresowanych przepraszam za swoja niekompetencje.’
    bo taka jest prawda, ze sie nie znasz i do tego jestes ignorantem – przynajmniej do takich wnioskow mozna dosc czytajac twpje odpowiedzi na komentarze pod niniejszym wpisem na blogu.

    co nie zmienia faktu ze artykul czytalo sie (laikowi-mi) bardzo dobrze.

  27. Magdalaena 6.8.2011, sobota o 7:05:40

    ja: „I oddawał sens problemu – tj. porównanie taśmy filmowej do mp3.”

    miastomasamaszyna: „O to właśnie chodzi, że w ogóle nie.”

    Ale z tekstu misek wynika, że tak. Tzn. inny jest poziom uproszczeń, ale ja zrozumiałam, że istotą pomysłu na mp3 jest właśnie takie stratne zapisanie dźwięku, żeby przeciętne ludzkie ucho nie słyszało różnicy między śpiewem na żywo a plikiem z komputera.

  28. wo 6.8.2011, sobota o 15:03:01

    @mom
    „nie mozesz po prostu napisac ‘jestem dziennikarzem i pisze artykul w dziedzinie o ktorej nie mam zielonego pojecia. wzelkich melomanow, fizykow i zainteresowanych przepraszam za swoja niekompetencje.’”

    Mogę! Po prostu odróżniam „błąd” (na przykład „analogowo-cyfrowy” zamiast „cyfrowo-analogowy”) od „uproszczenia” czy „pominięcia”, bo to jednak nie to samo, mimo pozornych podobieństw. Kolega Miskidomleka nie łapie tej różnicy, więc go trzeba troszkę przyedukować.

  29. miskidomleka 6.8.2011, sobota o 15:06:57

    @wo

    Nie. Napisałem, że od tego zaczynamy,

    Czas może na lekcje u Leszka Millera.
    Oraz, wskaż słowo „zaczynamy” lub podobne w okolicach metafory taśmy filmowej.

    nie wnikając w to, co z tymi danymi robimy później (przecież skoro są różne algorytmy to jasne, że są różne sposoby dalszej obróbki tego, co sobie spróbkowaliśmy).

    Tyle, że to, co z tymi danymi robimy później, jest istotą wynalazku Brandenburga.
    Oraz, mimo różnic, powszechnie używane algorytmy kompresji stratnej dźwięku korzystają z modelu psychoakustycznego. Którego zabrakło mi w Twoim tekście. Nie wzorkami, nie kosinusami, tylko prostym wytłumaczeniem co, jak i dlaczego.

    Może kiedyś napiszę o tym notkę

    Dawaj. Pogadamy, co gorsze, napisać przepis na pędzenie wódki: „trzeba zaorać, posiać, poczekać aż wyrośnie, zżąć i wymłócić, i już można się upić”, czy pominąć szczegóły rurek aparatury bimbrowniczej.

    @Magdalaena
    że istotą pomysłu na mp3 jest właśnie takie stratne zapisanie dźwięku, żeby przeciętne ludzkie ucho nie słyszało różnicy między śpiewem na żywo a plikiem z komputera.

    Pytanie, czy zrozumiałaś, jak to się robi. Bo metafora taśmy filmowej dotyczy zupełnie czego innego. Próbkowaniem a la taśma filmowa zapisuje się dźwięk do postaci cyfrowej, tylko że to nie jest mp3. Po próbkowaniu masz zapis bezstratny dźwięku (z ograniczeniami, które podałem wyżej), ilość danych jest niewygodnie wielka, i było to wynalezione, więcej, komercyjnie dostępne zanim Brandenburg dokonał swoich wynalazków. Taki bezstratny zapis, wynikający z próbkowania, masz na płytach CD czy w typowych plikach dźwiękowych WAV lub AIFF na komputaerze.

    Mp3 i wynalazek Brandenburga dotyczy czego innego: jak z tej ogromnej ilości danych zrobić coś wygodnie małego, co będzie brzmiało wystarczająco podobnie. Cel ten jest osiągnięty głównie dzięki „wyrzuceniu” tej cześci dźwięku, której, jak wiemy z psychoakustyki, ucho i tak nie usłyszy. Tej kluczowej informacji zabrakło mi u wo.

  30. miskidomleka 6.8.2011, sobota o 15:24:01

    @wo

    Kolega Miskidomleka nie łapie tej różnicy, więc go trzeba troszkę przyedukować.

    Główny problem leży w tym, że kolega WO nie łapie, że za daleko posunięte uproszczenie staje się błędem.

    A już zwłaszcza, gdy w ramach rzekomego uproszczenia pisze się o czym innym, niż się twierdzi, że się pisze.

  31. wo 6.8.2011, sobota o 15:29:15

    @miskidomleka
    „Oraz, wskaż słowo „zaczynamy” lub podobne w okolicach metafory taśmy filmowej”

    Nie ma też słowa „jak dojechać”, a jednak piszę, jak dojechać z Ilmenau do Erlangen.

    „Tyle, że to, co z tymi danymi robimy później, jest istotą wynalazku Brandenburga.”

    Zgoda! I o tym traktuje cały dalszy ciąg, jak kombinowali a to z tym, a to z tamtym. Masz chyba jednak dość uczciwości intelektualnej by przyznać, że pojęcia „próbkowania” nie można tu pominąć, bo nie można opisywać ” co z tymi danymi robimy później” bez napisania, że je w ogóle zebraliśmy, prawda?

    „Którego zabrakło mi w Twoim tekście. ”

    Jasne! Zenonowi Benonowi z Mycisk Niżnych zabrakło tam z kolei przepisu na bimber. Wszystkim się nie dogodzi. Tobie łatwo dogodzić przekierowaniem do wikipedii, gdzie znajdziesz sobie to, czego Ci zabrakło w moim tekście. Podać Ci gotowego linka czy sam se wyszukasz?

    „Pogadamy, co gorsze, napisać przepis na pędzenie wódki: „trzeba zaorać, posiać, poczekać aż wyrośnie, zżąć i wymłócić, i już można się upić”, czy pominąć szczegóły rurek aparatury bimbrowniczej.”

    I tu jest właśnie Twój zasadniczy błąd: Tobie się ciągle wydaje, że mój tekst był „przepisem na kompresję”. Otóż nigdy nie miałem zamiaru czegoś takiego napisać.

  32. wo 6.8.2011, sobota o 15:30:36

    @miskidomleka
    „Główny problem leży w tym, że kolega WO nie łapie, że za daleko posunięte uproszczenie staje się błędem”

    Jasna sprawa! Ale to nie było posunięte „za daleko” tylko „w sam raz”. Właśnie przed chwilą sprawdziłem moim miernikiem uproszczeń.

  33. miastomasamaszyna 6.8.2011, sobota o 15:32:48

    @wo
    Masz chyba jednak dość uczciwości intelektualnej by przyznać, że pojęcia „próbkowania” nie można tu pominąć,

    Właśnie próbkowanie można było pominąć najłatwiej.

    bo nie można opisywać ” co z tymi danymi robimy później” bez napisania, że je w ogóle zebraliśmy, prawda?

    Jak wszyscy, zgraliśmy je z płyty CD.

  34. miastomasamaszyna 6.8.2011, sobota o 15:33:27

    Tak z ręką na sercu: Próbkowałeś w życiu jakiś analogowy sygnał?

  35. wo 6.8.2011, sobota o 15:41:51

    @m3
    „Właśnie próbkowanie można było pominąć najłatwiej.”

    Nonsens.

    „Tak z ręką na sercu: Próbkowałeś w życiu jakiś analogowy sygnał?”

    No w życiu przecież, U nas na dziennikarstwie mieli wprawdzie rejestrator przepływu wody w kolumnie, ale ciągle go trzymali ci kolesie z wydziału Prawicowej Publicystyki.

  36. miastomasamaszyna 6.8.2011, sobota o 15:43:44

    @wo
    Nonsens.

    Biedny audiofilu, robiłeś swoje mp3 z vinyli?

  37. miskidomleka 6.8.2011, sobota o 17:17:39

    @wo

    Nie ma też słowa „jak dojechać
    Więc jeśli nie ma, może powstrzymaj się od pisania „Napisałem, że od tego zaczynamy”

    I o tym traktuje cały dalszy ciąg, jak kombinowali a to z tym, a to z tamtym
    Ale nie traktuje o tym, co jest istotą mp3, czyli o zastosowaniu modelu psychoakustycznego. Za to wcześniejszy ciąg opisuje próbkowanie tak, jakby to ono było odpowiedzialne za redukcję strumienia danych jaką mamy w mp3.

    Masz chyba jednak dość uczciwości intelektualnej by przyznać, że pojęcia „próbkowania” nie można tu pominąć, bo nie można opisywać ” co z tymi danymi robimy później” bez napisania, że je w ogóle zebraliśmy, prawda?
    Autocytat: „Podczas kodowania mp3 muzyka jest analizowana [przez program/komputer/algorytm] i odrzucane są te dźwięki, których, jak wiemy z lat badań psychoakustycznych, ucho i tak nie jest w stanie usłyszeć. Na przykład dlatego, że są zagłuszane (fachowcy mówią: „maskowane”) przez inne dźwięki”
    W ten deseń można przybliżyć o co chodzi w kodowaniu mp3, i nie potrzeba tłumaczyć, skąd się w komputerze wzięła ta muzyka. W szczególności opowiadać o próbkowaniu tyle a tyle razy na sekundę. W szczególności opowiadać bajek o „dopowiadaniu przez mózg” oraz o „zamiast kodować całość nagrania”.
    Jeśli uważasz, że próbkowanie było potrzebne, nie będę się kłócił, mnie by nie szkodziło. Ale model psychoakustyczny był potrzebny bardziej.

    Tobie się ciągle wydaje, że mój tekst był „przepisem na kompresję”.
    Jeśli miały być to wyłącznie polityczno-ekonomiczne rozważania na temat mechanizmu wprowadzania odkryć na rynek w Europie a w USA, po co pisałeś o próbkowaniu?

    Właśnie przed chwilą sprawdziłem moim miernikiem uproszczeń.
    Najwyższy czas na kalibrację miernika.

    @3m
    Tak z ręką na sercu: Próbkowałeś w życiu jakiś analogowy sygnał?

    Dobrze, że mnie nie pytasz, bo mnie się zdarza po parę godzin dziennie.

  38. miastomasamaszyna 6.8.2011, sobota o 17:24:11

    @miski
    No przecież wiem. Dlatego pytam audiofila WO, który pewnie po kupnie pierwszegp iPoda ripował swoje zbiory winyli i dlatego ma traumę na punkcie próbkowania. Normalni ludzie sobie zrobili mp3 z cedeków.

  39. niedofizyk 6.8.2011, sobota o 17:41:09

    @3m ja czasami ripuję, jak nie mogę znaleźć cyfrowej kopii i jakoś nie mam traumy z próbkowaniem. raczej ze zbieraniem kurzu pod igłą ;)

  40. wo 6.8.2011, sobota o 17:57:29

    @miskidomleka
    „Więc jeśli nie ma, może powstrzymaj się od pisania „Napisałem, że od tego zaczynamy””

    A wolno mi chociaż napisać „napisałem jak dojechać” czy też nie, skoro nie ma ciągu znaków „jak dojechać”?

    „Ale nie traktuje o tym, co jest istotą mp3,”

    Zgoda. Niewiele tam też o perspektywach rozwoju argentyńskiego rolnictwa.

    „Jeśli miały być to wyłącznie polityczno-ekonomiczne rozważania na temat mechanizmu wprowadzania odkryć na rynek w Europie a w USA, po co pisałeś o próbkowaniu?”

    Nie miały to być też wyłącznie polityczno-ekonomiczne rozważania na temat mechanizmu wprowadzania odkryć na rynek w Europie a w USA. Ty naprawdę jesteś człowiekiem, który najbardziej chciałby czytać tylko hasła w wiki, w których opisano jak coś działa oraz blogonotki, w ktorych ktoś coś rozważa.

    „Najwyższy czas na kalibrację miernika.”

    Zgoda, z Twoim zdecydowanie jest coś nie tak.

  41. niedofizyk 6.8.2011, sobota o 18:07:58

    @wo
    „Zgoda. Niewiele tam też o perspektywach rozwoju argentyńskiego rolnictwa.”
    Jakbyś wcale o istocie mp3 nie napisał, to by nie było problemu. Ale napisałeś, tylko po prostu błędnie. Wystarczy, że użyłeś słowa „kodować” w dwóch różnych znaczeniach. Jak niby czytający ma się połapać, że raz chodzi o próbkowanie, a raz o kompresję?

  42. wo 6.8.2011, sobota o 18:22:35

    @niedofizyk
    „Jakbyś wcale o istocie mp3 nie napisał, to by nie było problemu. Ale napisałeś, tylko po prostu błędnie.”

    Napisałem po prostu w ogromnym uproszczeniu. Gdybym zaś w ogóle nie wprowadził pojęcia próbkowania, przepadłby smakowity opis tego, dlaczego komputer się zapychał na „Tom’s Diner”.

    ” Jak niby czytający ma się połapać, że raz chodzi o próbkowanie, a raz o kompresję?”

    Czytający, który będzie chciał napisać własny enkoder albo odtwarzacz, powinien i tak zajrzeć gdzie indziej po techniczną dokumentację.

  43. niedofizyk 6.8.2011, sobota o 18:30:47

    @wo
    „Napisałem po prostu w ogromnym uproszczeniu.”
    Jest różnica między obrazem uproszczonym, a błędnym. W tym fragmencie wyszło po prostu klasyczne „ja o niebie, a ty o chlebie”:
    Zamiast kodować całość nagrania, wystarczy kilka- lub kilkadziesiąt tysięcy razy na sekundę robić tak zwane próbkowanie, czyli zapis dźwięku w danej chwili. Czego ucho nie usłyszy, to mózg dopowie[nieprawda, patrz tw. Nyquista], tak jak mózg wypełnia nam brakujący ruch na taśmie filmowej.

    – Na wczesnym etapie prac nad kodowaniem[a tu mowa o robieniu MP3 z PCM, a nie o próbkowaniu] dźwięku natrafiliśmy na paradoks nazywany żartobliwie dźwiękową zasadą Heisenberga – wspomina Brandenburg. – Im dokładniej potrafiliśmy oddać barwę dźwięku, tym gorzej wychodził rytm

    To nie jest zwykłe uproszczenie, srsly.

  44. wo 6.8.2011, sobota o 18:36:22

    @niedofizyk
    „Jest różnica między obrazem uproszczonym, a błędnym.”

    Cieszę się, że to do Ciebie dotarło – tłumaczę to teraz koledze Miskidomleka. Podobno zepsuł mu się miernik, ale na szczęście dotarło też do niego, że czas na serwis i kalibrację. Może będą z niego ludzie?

  45. niedofizyk 6.8.2011, sobota o 18:39:50

    „Cieszę się, że to do Ciebie dotarło”
    A teraz przeczytaj resztę.

  46. miskidomleka 6.8.2011, sobota o 23:03:16

    @wo

    Wiesz, jeśli chcesz mnie przekonać, że człowiek, który opisując wynalazek tak naprawdę opisuje inny wynalazek, w dodatku źle, a następnie dochodzi do wniosku że tylko uprościł a nie popełnił błędu – ma mierniki w porządku, musisz mocniej napiąć mięsień argumentacji.

    Gdybym zaś w ogóle nie wprowadził pojęcia próbkowania, przepadłby smakowity opis tego, dlaczego komputer się zapychał na „Tom’s Diner”.

    Przecież on się zapychał na kodowaniu mp3, nie na próbkowaniu. O ile mi wiadomo, Brandenburg nie siedział z przetwornikiem AC w studio gdzie Vega nagrywała piosenkę. Oraz, nie wiem czy jest Ci wiadomym, że gdy już ustalisz częstotliwość próbkowania i liczbę bitów, objętość strumienia danych i obciążenie przetwornika próbkującego są takie same, niezależnie czy próbkujesz klawesyn, Suzanne Vega, Robertę Invernizzi, szczekanie psa czy ciszę.

  47. wo 7.8.2011, Niedziela o 4:25:36

    @niedofizyk
    „A teraz przeczytaj resztę.”

    Proszę bardzo. Zarzucasz mi, że niefrasobliwie używam słowa „kodowania” nie wnikając w to, czy chodzi o próbkowanie czy o obróbkę próbki. Ten zarzut jest jaskrawie sprzeczny z tym, co ujawnili wybitni eksperci Miskidomleka i Trzyemski, którzy wykazali już jednoznacznie, że w moim tekście mowa jest wyłącznie próbkowaniu, nie ma nawet cienia sugestii, jakoby chodziło o coś jeszcze, cytuję na przykład: „on chyba naprawdę myśli, że trick z mp3 polega na odpowiednim próbkowaniu”.

    Zatem gdybyś Ty teraz miał wykazać, że w moim tekście pojawiają się informacje o tym, że dane zebrane próbkowaniem poddawane są w MP3 dalszej obróbce (w nawiasie na przykład interpretujesz pewien fragment jako „a tu mowa o robieniu MP3 z PCM, a nie o próbkowaniu”), to wykażesz przede wszystkim, że Miskidomleka i Trzyemski nie potrafią przeczytać prostego tekstu ze zrozumieniem. Bo przecież cała ich argumentacja zbudowana jest na „nigdy nie ma mowy o robieniu MP3 z PCM, wyłącznie próbkowaniu”, aż do poziomu chamowatej insynuacji, jakoby mi się wydawało, „że trick z mp3 polega na odpowiednim próbkowaniu”.

    No chyba nie chcesz robić idiotów z dwóch takich sympatycznych kolegów? Ja nie chcę, dlatego spuściłem na tę resztę zasłonę miłosierdzia. Ale skoro nalegasz…

    @miskidomleka
    „Przecież on się zapychał na kodowaniu mp3, nie na próbkowaniu. ”

    Zapychał się na dyskretnych danych, co barwnie opisał B. Jakbym nie wrzucił próbkowania, nie byłoby oczywiste, że są dyskretne – bo analogowe są ciągłe (mind you: w moim tekście nigdy nie pada słowo „dyskretne dane”, a jednak opisuję ich dyskretność). Gdyby w żaden sposób nie zasugerować czytelnikowi dyskretności – z kolei ta anegdota zrobi się niejasna.

    Chodzi tu nie o jasne/niejasne w sensie „dajemy kompletny przepis na napisanie własnego enkodera” tylko w sensie kompozycyjnym – jeśli w utworze literackim nagle po paru stronach opisu jakiegoś dialogu okaże się, że w pokoju jeszcze ktoś siedział, kto się włączy do rozmowy, to będzie błąd warsztatowy, bo czytelnik powie „ale skąd tu teraz ten koleś”. Innymi słowy, chodzi o gładkość lektury, z której na maksa próbujemy usunąć zonki tego typu („ale na czym się zapychał?”, „ale skad ten koleś w tym pokoju tak nagle?”, itd.)

  48. miskidomleka 7.8.2011, Niedziela o 9:15:04

    @wo
    Ten zarzut jest jaskrawie sprzeczny z tym, co ujawnili wybitni eksperci Miskidomleka i Trzyemski, którzy wykazali już jednoznacznie, że w moim tekście mowa jest wyłącznie próbkowaniu, nie ma nawet cienia sugestii, jakoby chodziło o coś jeszcze

    To co napisałeś, jest jaskrawie sprzecze z tym, co ujawniłem. Kolega 3M niech pisze za siebie. Otóż ja Ci zarzucam, że pisząc o kodowaniu mp3 jako mechanizm podałeś próbkowanie. A nie, że w ogóle nie piszesz o kodowaniu mp3.

    Zgadzam się z niedofizykiem, że niefrasobliwe używanie słowa „kodowanie” w dwóch znaczeniach nie pomaga przejrzystości tekstu.

    Zapychał się na dyskretnych danych, co barwnie opisał B. Jakbym nie wrzucił próbkowania, nie byłoby oczywiste, że są dyskretne – bo analogowe są ciągłe (mind you: w moim tekście nigdy nie pada słowo „dyskretne dane”, a jednak opisuję ich dyskretność). Gdyby w żaden sposób nie zasugerować czytelnikowi dyskretności – z kolei ta anegdota zrobi się niejasna.

    Myślę, że dałoby się to napisać bez sugerowania dyskretności. Na przykład można wychodząc od mojego fragmentu o analizie i odrzucaniu napisać, że głos SV był akurat taki, że nawet po odrzuceniu składowych niesłyszalnych na podstawie modelu psychoakustycznego zostawało zbyt dużo danych, by zmieściły się w oczekiwanej przepływności. Było ich tak dużo, że objętość przewidzianą na sekundę muzyki zużywały w pół sekundy.
    Ale zauważ, że ja nie protestuję przeciwko opisywaniu próbkowania, protesuję przeciwko opisaniu go źle i zamiast modelu psychoakustycznego. Jeśli należało oszczędzać miejsce, stosowniejsze byłoby wyrzucenie próbkowania i pozostawienie modelu psychoakustycznego.

    @chamskie insynuacje.
    Nie da się ukryć, że jest sporo pośrednich poszlak za słusznością „chamskiej insynuacji”, za tym, że pisząc tekst myślałeś, że oszczędność miejsca przez mp3 wynika wyłącznie z doboru częstotliwości próbkowania. Te poszlaki to:
    – używanie jednego słowa „kodowanie” na próbkowanie i kodowanie mp3
    – w tekście o mp3 opis działania „kodowania muzyki” ogranicza się do opisu próbkowania
    – skrócenie nazwy OCF – jakby tam chodziło o dobór częstotliwości kodowania (próbkowania?)
    – „Zamiast kodować całość nagrania, wystarczy kilka- lub kilkadziesiąt tysięcy razy na sekundę robić tak zwane próbkowanie” – do przyzwoitego kodowania muzyki z zachowaniem sensownego pasma częstotliwości z racji twierdzenia o próbkowaniu trzeba stosować kilkadziesiąt tysięcy, kilka jest za mało. Twoim motywem dla napisania „kilka” mogło być przekonanie, że kodowanie mp3 polega na zmniejszeniu cz. próbkowania do „kilku” kHz, zeby osiągnąć przepływnośc kilkanaście razy mniejszą niż CD Audio.

    Ale to są tylko poszlaki, nie mam zamiaru się upierać przy takim odczytywaniu Twoich motywów, zarzuty, powtarzam, dotyczą (głównie) opisaniu próbkowania a nie modelu psychoakustycznego jako mechanizmu kodowania mp3.

  49. wo 7.8.2011, Niedziela o 10:05:15

    @miskidomleka
    ” Otóż ja Ci zarzucam, że pisząc o kodowaniu mp3 jako mechanizm podałeś próbkowanie. ”

    I to jest jaskrawie sprzeczne z tym, co pisze kolega Niedofizyk – który wręcz wskazuje fragment mojego tekstu pisząc „[a tu mowa o robieniu MP3 z PCM, a nie o próbkowaniu]”.

    „Myślę, że dałoby się to napisać bez sugerowania dyskretności”

    A ja myślę, że nie.

    ” Jeśli należało oszczędzać miejsce, stosowniejsze byłoby wyrzucenie próbkowania i pozostawienie modelu psychoakustycznego.”

    Nie, bo priorytetem nie było „jak najdokładniejsze opisanie algorytmu” tylko „uniknięcie zonka przy smakowitej anegdotce o zapychaniu dyskretnymi danymi”.

    „Nie da się ukryć, że jest sporo pośrednich poszlak za słusznością „chamskiej insynuacji”, za tym, że pisząc tekst myślałeś, że oszczędność miejsca przez mp3 wynika wyłącznie z doboru częstotliwości próbkowania.”

    Kolega Niedofizyk jednak wykazał się trochę lepszą umiejętnością czytania ze zrozumieniem i wykrył w moim tekście miejsca, w których wyraźnie sugeruję co innego.

    „Ale to są tylko poszlaki, nie mam zamiaru się upierać przy takim odczytywaniu Twoich motywów, zarzuty, powtarzam, dotyczą (głównie) opisaniu próbkowania a nie modelu psychoakustycznego jako mechanizmu kodowania mp3.”

    Czyli że zarzucasz mi, że napisałem reportaż o twórcach MP3, zamiast przekleić opis algorytmu z Wiki. Guilty as charged, your honor.

  50. niedofizyk 7.8.2011, Niedziela o 12:56:40

    @wo
    „Kolega Niedofizyk jednak wykazał się trochę lepszą umiejętnością czytania ze zrozumieniem i wykrył w moim tekście miejsca”
    Tak, szkoda, że we fragmencie, który jest przytoczoną wypowiedzią.

  51. wo 7.8.2011, Niedziela o 15:13:14

    @niedofizyk
    „Tak, szkoda, że we fragmencie, który jest przytoczoną wypowiedzią.”

    Ach, zatem najnowsza wersja jest taka, że ja wprawdzie byłem głęboko przekonany, że chodzi wyłącznie o próbkowanie – ale machinalnie spisałem z taśmy, że niby jednak nie tylko i dopiero ta fascynująca dyskusja mi wyjaśniła, co dokładnie powiedział Brandenburg?

    Nie uważasz, że ta wersja jest jeszcze bardziej nieprawdopodobna od poprzedniej?

  52. niedofizyk 7.8.2011, Niedziela o 15:53:10

    @wo
    „Nie uważasz, że ta wersja jest jeszcze bardziej nieprawdopodobna od poprzedniej?”

    Niestety nie. Użycie przez Ciebie zwrotu „zmienna częstotliwość próbkowania” w dalszej części tekstu świadczy raczej na jej korzyść. Po prostu nie wiedziałeś o czym piszesz, a teraz wykręcasz się, że „przecież nie o tym był ten tekst” albo „uproszczenie”. BTW, z uporem godnym lepszej sprawy, bo to przecież nie praca doktorska.

  53. wo 7.8.2011, Niedziela o 17:15:01

    @niedofizyk
    „Po prostu nie wiedziałeś o czym piszesz, ”

    No jasne! Tak to przeważnie jest z reportażami, spisuje się po prostu jak leci słowa rozmówcy, nie rozumiejąc ich. Widzę, że w sieci sami spece od dziennikarstwa.

    ” BTW, z uporem godnym lepszej sprawy, bo to przecież nie praca doktorska.”

    Zawsze mnie śmieszą ludzie, którzy nie rozumieją, że ktoś coś może uprościć absolutnie celowo. I oczywiście zamierzam ich walcować w imię walki o lepsze jutro, bo świat, w którym wszystko jest tylko hasłem z wikipedii, byłby okropny.

  54. fizyk 8.8.2011, poniedziałek o 15:57:11

    @wo
    „Tak to przeważnie jest z reportażami, spisuje się po prostu jak leci słowa rozmówcy, nie rozumiejąc ich.”

    Dokładnie tak to wygląda post factum. Nie wiem dlaczego dziennikarze tak robią, mogę się jedynie domyślać (czas, kasa, wymogi rynku, etc.).

    „Zawsze mnie śmieszą ludzie, którzy nie rozumieją, że ktoś coś może uprościć absolutnie celowo.”

    Ależ nikt tutaj nie zarzuca, że nie uprościłeś tego celowo. Problem w tym, że upraszczając usunąłeś całą treść. Mi się twój reportaż podoba, jednak o MP3 jest tam niewiele. Wręcz uproszczenia są mylące i mogą sugerować zgoła inne rzeczy niż te, które chciałeś.

    A tak na marginesie – spisywanie słów rozmówcy jak leci zwykle niesie ze sobą mniejsze ryzyko błędów. Parafrazowanie, upraszczanie, skracanie może zmieniać sens wypowiedzi. Jak w tym dowcipie o tramwaju co jest czerwony i często staje. :-)

  55. wo 8.8.2011, poniedziałek o 16:49:52

    @fizyk
    „Dokładnie tak to wygląda post factum. Nie wiem dlaczego dziennikarze tak robią,”

    Nie wiesz nawet, czy tak robią.

    „Ależ nikt tutaj nie zarzuca, że nie uprościłeś tego celowo.”

    Znaczy, mnie też czasem wkurza Trzyemski, zwłaszcza gdy leci chamowatymi insynuacjami typu „on chyba naprawdę myśli, że trick z mp3 polega na odpowiednim próbkowaniu” – ale jednak nie nazywałbym go „nikim”.

    „A tak na marginesie – spisywanie słów rozmówcy jak leci zwykle niesie ze sobą mniejsze ryzyko błędów. ”

    I to mi się najbardziej podoba – te wszystkie konfabulacje na temat warsztatu pracy reportera. Czy jeszcze ktoś mógłby rzucić coś w tym stylu?

  56. miskidomleka 8.8.2011, poniedziałek o 18:16:06

    @wo
    I to jest jaskrawie sprzeczne z tym
    Nie jest. Bo tam nie opisywałeś mechanizmu. Oraz to niedofizyk wiedząc, w jakie sytuacji występuje nieoznaczoność, wywnioskował że chodzi o kodowanie mp3. Czytelnik, który tego nie wie, może nadal sądzić, że mowa o próbkowaniu. Ja też nie mogę być pewny czy nie myślałeś, że w jakiś sposób problem Heisenberga pojawia się przy zmniejszania częstotliwości próbkowania?

    „Myślę, że dałoby się to napisać bez sugerowania dyskretności”
    A ja myślę, że nie.

    I w jaki sposób to, co napisałem („głos SV był akurat taki, że nawet po odrzuceniu składowych niesłyszalnych…”) staje się nieczytelne/mniej smakowite/powoduje zonka, jeśli dyskretność danych nie jest uprzednio zasugerowana?

    Zawsze mnie śmieszą ludzie, którzy nie rozumieją, że ktoś coś może uprościć absolutnie celowo. I oczywiście zamierzam ich walcować w imię walki o lepsze jutro, bo świat, w którym wszystko jest tylko hasłem z wikipedii, byłby okropny.
    Ja rozumiem, i popieram celowe upraszczanie.
    Natomiast zawsze martwią mnie ludzie, którzy wprowadzają czytelników w błąd. I oczywiście zamierzam ich walcować w imię walki i lepsze jutro, bo świat, w którym ludzie czynią to bez najmniejszej żenady, czy to nadmiernie upraszczając, czy po porstu nie rozumiejąc o czym piszą, byłby, wróć, jest okropny.
    Więc pewnie się jeszcze na tym polu spotkamy.

    Czyli że zarzucasz mi, że napisałem reportaż o twórcach MP3, zamiast przekleić opis algorytmu z Wiki
    Nie. I nie chce mi się po raz n-ty tłumaczyć, dlaczego nie. Jak nie pojmujesz, to trudno.

  57. telemach 9.8.2011, wtorek o 7:35:14

    Jakie piękne to. I pouczające. Rozmowę ułatwiło by jednak stwierdzenie, że definicję Orlińskiego, w myśl której Orliński jest nieomylny, stworzył Orliński. A ludzie przywiązują się do swoich dokonań. Co jest zasadniczo dobre.

  58. wo 9.8.2011, wtorek o 8:47:45

    @miskidomleka
    „I w jaki sposób to, co napisałem („głos SV był akurat taki, że nawet po odrzuceniu składowych niesłyszalnych…”) staje się nieczytelne/mniej smakowite/powoduje zonka, jeśli dyskretność danych nie jest uprzednio zasugerowana?”

    Otóż najpierw musisz wejść daleko we wprowadzanie pojęcia „składowej niesłyszalnej” tylko po to, żeby potem mieć zgrzytliwie brzmiące zdanie, w którym wykorzystujesz to pojęcie. Twoja propozycja po prostu wszystko to by mocno wydłużała.

    „Natomiast zawsze martwią mnie ludzie, którzy wprowadzają czytelników w błąd”

    Nie da się nie wprowadzać, bo tu masz jeszcze inną prawidłowość, którą można metaforycznie nazwać zasadą Heisenberga – im dokładniej opisujesz jedno, tym mniej dokładnie opisujesz drugie, aż do poziomu wprowadzania w błąd. Na przykład jeśli nazwiesz Linusa Torvaldsa „Finem”, to będzie zamulało jego etniczną złożoność. Z kolei wnikanie w te detale w tekście o kernelowaniu kompili niepotrzebnie odwracałoby uwagę od zasadniczego tematu tekstu o kernelowaniu kompili. Dlatego albo masz tekst o mniejszości szwedzkiej w Finlandii, w której chlapniesz beztroskim uproszczeniem „na przykład twórca systemu operacyjnego Linux” (wprowadzającym w błąd, bo przecież ściśle rzecz biorąc, Linux to tylko kernel a nie cały system), albo masz tekst o kernelizacji kompili, w którym wprowadzasz w błąd co do całej etnicznej złożoności, za to masz miejsce na całe zniuansowanie kwestii „Linux to kernel”.

    Morał z tego jest taki, że trzeba zawsze wiedzieć, o czym tekst się czyta żeby wiedzieć, gdzie autor ma fokus ostrości.

  59. Tomash 9.8.2011, wtorek o 9:43:41

    Bardzo ładne wyjaśnienie. Baboli jako fizyk nie znalazłem, chociaż z akustyki jestem taki-sobie.

    @niedofizyk: Nie do końca prawda z tą fazą. Uszy ludzkie (a raczej: mózg) wyłapują różnicę faz, dzięki czemu są w stanie określić kierunek (kąt) źródła dźwięku.
    Istniały zresztą całkiem zaawansowane badania nad słuchawkami świetnie imitującymi przestrzenny dźwięk (as in z różnych kierunków), wykorzystujące właśnie to zjawisko, ale nie wiem na jakim to jest teraz etapie.

  60. miskidomleka 9.8.2011, wtorek o 16:39:03

    @wo
    Twoja propozycja po prostu wszystko to by mocno wydłużała.
    Może tak, może nie. Trzeba by usiąść i to porządnie napisać, a ja za Ciebie roboty nie będę odwałał ;-).

    im dokładniej opisujesz jedno, tym mniej dokładnie opisujesz drugie […] gdzie autor ma fokus ostrości
    Więc mój postulat jest taki, żeby to na czym jest fokus, opisywać dokładnie. A to na czym nie ma, albo opisać wystarczająco dokładnie by nie wprowadzić czytelnika w błąd, albo wyciachać całkiem.

    Ty zdaje się nie bywasz na socjalmediach, więc pozwól, że zacytuję tutaj pewnego naszego internetowego znajomego : „No i faktycznie ja — który bladego pojęcia o mp3 nie miałem — też się dałem artykułowi WO zrobić, dopiero miskidomleka wyjaśnił mi co i jak.”.
    I nie chodzi mi nawet o to, że wyjaśniłem (choć mile łechce), tylko że Tobie „dał się zrobić”.

  61. miskidomleka 9.8.2011, wtorek o 16:42:24

    @Tomash
    Mam napisany kawałek notki od rozróżnianiu kierunków przy słuchaniu, bo lubię temat, i tam dzieje się wiele ciekawych rzeczy, nie tylko faza. Dawno to już napisałem, notka miała być megadygresją wychodzącą od altmedowej praktyki świecowania uszu. Niestety w międzyczasie ktos (Czajniczek Pana Russela?) napisał o świecowaniu, i straciłem serce. Może kiedyś.

  62. wo 9.8.2011, wtorek o 17:27:02

    @miskidomleka
    „Może tak, może nie. Trzeba by usiąść i to porządnie napisać, a ja za Ciebie roboty nie będę odwałał ;-).”

    Jasne – ale na mojego czuja no can do.

    „A to na czym nie ma, albo opisać wystarczająco dokładnie by nie wprowadzić czytelnika w błąd, albo wyciachać całkiem.”

    Nie do zrobienia, bo z kolei trudno nie wspomnieć w ogóle, że Torvalds ma coś wspólnego z Finlandią (gdy piszesz o kernelowaniu kompila), albo że Linux to coś w rodzaju systemu operacyjnego (gdy piszesz o mniejszości szwedzkiej w Finlandii). Twój postulat jest uroczy, ale nierealizowalny. Są rzeczy, których nie możesz wyciachać całkiem, ale jednocześnie nie masz możliwości opisać ich tak dokładnie, żeby nikt się w żaden sposób nie wprowadził w błąd.

    „I nie chodzi mi nawet o to, że wyjaśniłem (choć mile łechce), tylko że Tobie „dał się zrobić”.”

    Straszne. Biedak z pewnością teraz nie napisze swojego enkodera.

  63. niedofizyk 9.8.2011, wtorek o 21:55:33

    @Tomash racja, uprościłem. Chodziło o to, że jak pomieszasz fazy poszczególnych częstotliwości (co robi np. zwrotnica w kolumnie), to nie usłyszysz różnicy względem takiego „fazowo dokładnego” nagrania.

  64. andsol 9.8.2011, wtorek o 22:48:17

    Wyjaśniam czemu tak sympatycznie wspomniany („Jak przyjdzie andsol lub inni matematycznie sprawni”) przychodzę tak późno. Ale mimo tego wcale nie było tu nudno, oj, co nie, to nie.

    A więc, na tych prawie antypodach zaczął się właśnie nowy semestr i to jest motyw, by głęboko wdać się w dylemat: przygotować materiały dla studentów, którzy i tak nie chcą ich widzieć czy też raczej popełnić samobójstwo. Oczywiście, rozwiązanie (cykliczne, dwa razy w roku od lat powtarzane, więc na miejscu przy okazji opisów zjawisk cyklicznych) brzmi: ani jedno, ani drugie, i życie idzie dalej.

    W kwestii podania pojęć matematycznych przez prostego biologa, przede wszystkim powiem jak szczęśliwy jestem, że nigdy nie udawałem bycia kimś innym niż prostym matematykiem, bo w innym stanie rzeczy byłbym teraz przymuszony przyznać, że jestem w prawie wszystkim kompletnym ignorantem, który zadziwia się gdzie inni ludzie tyle wiedzy trzymają. Podejrzewam, że w głowach mają mózgi. No więc wyrazy uznania, a na temat części matematycznej rzekę: bardzo bym chciał, by moi koledzy-matematycy potrafili (z taką pozorną prostotą) przedstawić w paru słowach istotę zjawiska matematycznego bez zanudzania symbolami i formalizmami. Może im jest trudniej, bo wielu z nich ma tylko znajomość formalizmów, a Ty po odrzuceniu ich ciągle jeszcze jesteś prostym biologiem, więc nie masz wątpliwości egzystencjalnych. W każdym razie, bardzo jasno wyłożyłeś czemu matematycy takie skomplikowane konstrukcje wprowadzają: właśnie dlatego, żeby uprościć rzetelną analizę szczegółów.

    Do kolegów matematyków: nic nie mam przeciw symbolom i formalizmom. Wręcz przeciwnie: żyję z nich. Ale one mają pojawiać się (na ogół, dodajmy, by uniknąć kroku ku fanatyzmowi symplicjonistycznemu) po zrozumieniu na czym polega zjawisko, a nie dla wyłuskiwania z nich tzw. „interpretacji” w fizyce czy w czymś innym. Niby oczywiste, najpierw słowo, potem jego zapis, ale kierunek nałogowo wykręcany na odwyrtkę przez fachowców.

    A jako latecomer powiem, że mam szczęście… Bo kiedyś do mego cichego blogu z życzliwym słowem zajrzał wo i jeden z przyjaciół rzekł: o, teraz istniejesz naprawdę. Jak powiedziałem, wygląda na to, że mam szczęście, że tylko raz miałem tę przyjemność.

  65. Tomash 10.8.2011, środa o 3:09:54

    @miskidomleka: chętnie przeczytam (jak potrzebujesz prostych objaśniających rysunków dlaczego faza pozwala rozpoznać kierunek, to coś mogę sklecić), rozwinięcia tematu od strony biologicznej trochę mi w tej wiedzy brakuje
    (a jakbyś jeszcze notkę o badaniach neuronów sensorycznych, tych rozpoczętych od aksona kałamarnicy wielkiej, to w ogóle — moja praca magisterska jest o symulacji modeli właśnie takich neuronów)

  66. Tomash 10.8.2011, środa o 3:11:45

    @andsol: są niestety zjawiska które bardzo ciężko wyjaśnić bez zagłębiania się w formalizm matematyczny. mam na myśli oczywiście zjawiska kwantowe.

  67. miasto-masa-maszyna 10.8.2011, środa o 3:24:00

    @wo
    „Myślę, że dałoby się to napisać bez sugerowania dyskretności”

    A ja myślę, że nie.

    Opisać model psychoakustyczny da się w ogóle nie używając pojęcia dyskretności. Używamy go na dyskretnych danych bo takie nam łatwo obrabiać komputerami, ale w praktyce takie rzeczy jak maskowanie jednych dźwięków przez drugie (nawet nie trzeba się wgłębiać tak żeby używać pojęcia alikwotów), to że zdolność do wychwytywania kierunku z którego dochodzi dźwięk mocno zależy od jego wysokości (stąd niskie częstotliwości można zapisać w mono), to że ucho ma bezwładność dynamiczną (przez parę ms od głośnego dźwięku i tak nie słyszymy cichych szczegółów) itp. to są rzeczy zachodzące w analogowym świecie.

    Laikowi wystarczy napisać, że używamy tego modelu aby wyciąć z dźwięku to czego i tak nie słyszymy, a więc zmniejszyć ilość zapisywanych danych. I już. Nie trzeba bredzić, że częstotliwość próbkowania ma cokolwiek z tym wspólnego albo że przy spróbkowanym dźwięku mózg sobie „dopowiada” coś między próbkami dowodząc tym tylko, że nie znasz prawa Kotielnikowa-Shannona.

  68. wo 10.8.2011, środa o 8:08:56

    @m3
    „Opisać model psychoakustyczny da się w ogóle nie używając pojęcia dyskretności”

    To jasne – ale ja w ogóle nawet nie próbuję go opisywać. Potrzebowałem wprowadzenia do smakowitej anegdoty o zapychaniu się komputera na dyskretnych danych, a nie możliwie jak najdokładniejszego opisania modelu.

    „Laikowi wystarczy napisać, że używamy tego modelu aby wyciąć z dźwięku to czego i tak nie słyszymy, a więc zmniejszyć ilość zapisywanych danych”

    Ty cały czas zakładasz priorytet typu „wyjaśmy laikowi jak to działa”, a nie „jak uniknąć zgrzytliwego zonka na anegdocie o zapychaniu”.

  69. miasto-masa-maszyna 10.8.2011, środa o 8:22:28

    Potrzebowałem wprowadzenia do smakowitej anegdoty o zapychaniu się komputera na dyskretnych danych, a nie możliwie jak najdokładniejszego opisania modelu.

    No i właśnie na tym się wyłożyłeś. Dane w komputerze są dyskretne by definition (a w już zwłaszcza muzyka jest by definition od czasów CD), więc nie trzeba było żadnego wprowadzenia o próbkowaniu. A Ty wprowadziłeś 1) niepotrzebnie, 2) mętnie, 3) z błędami.

    Ty cały czas zakładasz priorytet typu „wyjaśmy laikowi jak to działa”

    Nie zakładam żadnego priorytetu. Jakbym był redaktorem to bym Ci te smęcenia o próbkowaniu po prostu wyciął. I może by się 1) zmieściło w jednym kawałku, 2) nadawało do papieru.

  70. wo 10.8.2011, środa o 10:21:34

    @m3
    „No i właśnie na tym się wyłożyłeś. Dane w komputerze są dyskretne by definition (a w już zwłaszcza muzyka jest by definition od czasów CD), więc nie trzeba było żadnego wprowadzenia o próbkowaniu. A Ty wprowadziłeś 1) niepotrzebnie, ”

    Potrzebnie, bo późniejsza anegdota o zapychaniu na głosie Vegi brzmiałaby zgrzytliwie bez tego wprowadzenia – nie mógłbym jej bez tego wprowadzenia zostawić takiej, jaka jest. A taka jaka jest, jest fajna.

    „Jakbym był redaktorem to bym Ci te smęcenia o próbkowaniu po prostu wyciął. ”

    No ale właśnie nieprzypadkowo nie jesteś. Jeśli założyć, że szczerze wierzysz w to wszystko, co na ten temat napisałeś, byłbyś złym redaktorem, na przykład poświęcającym smakowitą anegdotkę dla „uniknięcia wprowadzania w błąd”. Złe priorytety.

  71. miskidomleka 10.8.2011, środa o 14:54:00

    @andsol
    Serdecznie dziękuję, słowa matematyka edukatora wiele dla mnie (doświadczalnika biologa) znaczą.

    @Tomash
    Dzięki, jak będę potrzebował pomocy, to się zgłoszę. Na szczęście mając Matlaba, Corela i programy do obróbki dźwięku można dość łatwo wiele narysować w tym temacie.

    O modelowaniu jak działa neuron, jak generuje potencjały czynnościowe czy coś takiego, może lepiej sam napisz, ja mogę być trochę za daleko tej wiedzy ;-)

    @główny nurt
    Myślę, że trochę zaczynamy się kręcić w kółko. Mamy problem poglądów estetycznych na anegdotkę o głosie Vegi napisaną bez wcześniejszego opisu próbkowania, którego łatwo nie rozwiążemy bo dotyczy estetyki, oraz, co ważniejsze, ktoś by musiał spróbować napisać anegdotkę w taki sposób, teraz gdybamy.
    Oraz mamy główny problem „prostota czy prawda”, który jest w pewien sposób problem estetyczno-etycznym, trudnym do argumentowania.
    Czas chyba kończyć przeto, kto co chciał powiedzieć, powiedział, kto czytał, zdanie jakieś sobie wyrobił.

    Naturalnie, jeśli P.T. komentatorzy zechcą się jeszcze pokręcić w kółko, nie będę czynił wstrętów. A nawet, jeśli pojawią się myśli nowe i świeże, włączę się. Ale się nie spodziewam.

  72. miastomasamaszyna 10.8.2011, środa o 15:05:35

    @wo
    Jeśli założyć, że szczerze wierzysz w to wszystko, co na ten temat napisałeś, byłbyś złym redaktorem, na przykład poświęcającym smakowitą anegdotkę dla „uniknięcia wprowadzania w błąd”. Złe priorytety.

    No tak. Zapomniałem, że w dziennikarstwie najważniejsza jest anegdotka. Dzięki za sprowadzenie na ziemię i spełnienia zawodowego życzę.

  73. fizyk 10.8.2011, środa o 16:15:18

    @wo
    „Nie wiesz nawet, czy tak robią.”

    Nie interesuje mnie jak robią. Piszę jak to wygląda jak czyta się teksty dziennikarzy. Nie obchodzi mnie co robią i jak robią. Ja oglądam wynik. A ten jest – w obszarze związanym z rzeczami bliskimi nauki – często żałosny.

    „I to mi się najbardziej podoba – te wszystkie konfabulacje na temat warsztatu pracy reportera. Czy jeszcze ktoś mógłby rzucić coś w tym stylu?”

    Człowieku otrzeźwiej. Miej sobie warsztat jaki chcesz. Tylko zadbaj o efekt końcowy.

    Nie powiedziałeś nic merytorycznego na temat.

  74. wo 10.8.2011, środa o 16:51:32

    @m3
    „Zapomniałem, że w dziennikarstwie najważniejsza jest anegdotka.”

    Zależy oczywiście od formy i tematu. Gdyby ktoś kiedyś u mnie zamówił tekst typu „streszczenie o co chodzi w tym algorytmie”, miałbym inne prioryrety. Tylko w sumie po cholerę komu taki tekst, skoro zainteresowani mogą to sobie wyguglać?

    @fizyk
    „Nie interesuje mnie jak robią. Piszę jak to wygląda jak czyta się teksty dziennikarzy. Nie obchodzi mnie co robią i jak robią”

    Napisałeś – cytuję ponownie – „Nie wiem dlaczego dziennikarze tak robią, mogę się jedynie domyślać”. To zdanie wyraźnie sugeruje, że uważasz, że tak właśnie robią. Najpierw więc tworzysz sobie jakąś własną fantasmagorię, a potem na jej bazie tworzysz dalsze konfabulacje. To bardzo charakterystyczne dla tego typu „przeciwników wprowadzania w błąd”, przeważnie sami nie są świadomi tego, jak bardzo bełkotliwe i mętne są ich własne wypowiedzi. I strasznie się zaperzają, gdy im się to zademonstruje przez cytowanie ich własnych słów.

  75. miastomasamaszyna 10.8.2011, środa o 17:06:24

    @wo
    Gdyby ktoś kiedyś u mnie zamówił tekst typu „streszczenie o co chodzi w tym algorytmie”, miałbym inne prioryrety. Tylko w sumie po cholerę komu taki tekst, skoro zainteresowani mogą to sobie wyguglać?

    Dlatego właśnie #niepłakałempoprasiepapierowej (i po innej też). EOT z mojej strony. Jeszcze raz powodzenia, póki jeszcze zamawiają.

  76. kaneis 12.8.2011, piątek o 2:20:11

    Na blogu Andsola pozwoliłem sobie zbyt obszernie skomentować artykuł WO i powyższe ciekawe uściślenia Gospodarza. Moja uwaga do sporu MdM i WO jest w skrócie taka.
    Za racji wykształcenia i zainteresowań czytałem WO w Gazecie i MdM z na blogu z nastawieniem: „jakie jeszcze ciekawe szczegóły lub anegdoty usłyszę”, „jakie generalne refleksje, myśli na tych szczegółach zostaną oparte” oraz ze sportową ciekawością „jak wyważy autor uproszczenia aby osiągnąć generalny cel i walory literackie – czytalność”. U WO celem jest chyba pokazanie europejskiego modelu współpracy nauki i przemysłu, w tym filozofii życiowej i podejścia do kariery i pieniędzy (tu:post NRD-owskich naukowców). Czytalność jest. Ale myślę, że główne uproszczenie, pomijające sedno MP3, zatrzymujące się na etapie 25 klatek lub 41tys.próbek, zaciemnia i przeczy temu celowi. Próbkowanie to odkrycie na poziomie „lutownicy i drucików”, na poziomie techników bez teoretycznego wykształcenia – braci Lumiere (przytrzymywanie klatek filmu nieruchomo na chwilę zamiast ciągłego przesuwania u Edisona – co poprawiło ostrość). MP3 to wynalazek idący dużo dalej, wykorzystujący i zaawansowaną matematykę (analiza funkcjonalna uogólniająca dyskretną i ciągłą wersję transformacji Fouriera), i świetny algorytm (szybkość) i psychoakustykę. Rzemiosło, elektronika i zdolności techniczne były tu ważnym, ale tylko dodatkiem. Tu już potrzebny jest instytut naukowy oraz model współpracy nauka-przemysł i dzielenia zysków z wynalazku.

  77. mamula66 12.8.2011, piątek o 17:19:38

    Mnie zas ciekawi skad sie wzial konforntacyjny ton komentarzy miskidomleka wzgledem WO? Czyzby miskoidomleka uwazal ze ma monopol na objasnianie ludnosci MP3?…Jezeli tak, to objesnienie oferowane pzrez miskidomleka jest tez dosyc powierzchowne. A najwazniejsce: cele i publicznosc artykulu WO nic nie mialy wspolnego z koniecznoscia objasniania twierdzenia Nyquista-Kotielnikowa-Shannona. WO chaial przedstawic LUDZI wynalazku, miskidomleka chcial sie pomadrzyc O WYNALAZKU. To dwa rozne zwierzeta.

  78. miastomasamaszyna 12.8.2011, piątek o 17:21:01

    Mnie zas ciekawi skad sie wzial konforntacyjny ton komentarzy miskidomleka wzgledem WO?

    Ze wzajemności, jak przypuszczam.

  79. miskidomleka 12.8.2011, piątek o 17:25:12

    @mamula66

    Pewne odpowiedzi dałem Ci u Andsola. Oraz może przeczytaj jeszcze raz notkę i komcie pod nią, może załapiesz o co poszło, bo na razie, mówiąc delikatnie, piszesz od rzeczy.

  80. mamula66 12.8.2011, piątek o 17:32:12

    miskidompela: ” raz notkę i komcie pod nią”

    Ktora notke?

  81. miskidomleka 12.8.2011, piątek o 17:33:31

    Tę pod którą piszemy w tej chwili. Notkę i komentarze.

  82. mamula66 12.8.2011, piątek o 18:16:22

    miskidomleka. To nei „notatka”. To esej.

    Jezcze raz powtozre moje wrazenie, z lektury. Bez uprzedzen. Przeczytalem tekst WO i tekst powyzej. WO napisal bardzo dobry artykul. Miskodomleka sa od pierwszego zdania wzgledem WO napastliwe. W razie czego sluze cytatami.

    Mam ze dwie polki ksiazek o Einsteinie. Tylko jedna ksiazka biograficzna przeplata sie z fizyka na jako takim poziomie. Inne traktuja o Einsteinie jako czlowieku i naukowcu, a o jego nauce traktuja na poziomie odpowiednim dla przecietnego zjadacza chleba. Nikt autorow sie z tego powodu nie czepia, nie prostuje ich wywodow fizycznych, sila rzecy maksymalnie uprosczonych i nie uzupelnia wlasnymi. Albowiem jasne jest ze jak ktos sie bedzie chcial dowiedziec o teorii wzglednosci, to nei bedzie czytal ksiazki „Einstein i jego czasy”

    Podobnie z artykulem WO. On napisal o czlowieku ktory wymyslil MP3 i o tym jak do tego doszlo. Jak dziala MP3 jest w tym kontekscie zupelnie obojetne. Owszem, to i owo mozna napisac, zeby bylo wiadomo o co ogolnie chodzi, ale jak kotos bedzie chcial sie dowiedziac jak funkcjonuje MP3, to musi zajrzec do odpowiednich ksiazek. Nawet lektura eseju napisanego pzrez miskidomleka nie wystarczy.

    Wiec nie wiem czemu miskido mleka jest wzgledem WO wlasnei konfrontacyjny. To tak samo jakby wzgledem autora ksiazki „Einstein i jego czasy” miec zarzut ze nie omowil on dostatecznie dokladnie geometrii przestrzeni Minkowskiego. Sorry, nie ten czytelnik.

    Zas miskidomleka tez ma swoj udzial w „neidociagnieciach”, cytuje: ” o częstotliwościach nie większych niż B może zostać wiernie zapisany za pomocą próbkowania z częstotliwością próbkowania 2B. Wiernie – czyli mózg nic nie musi dopowiadać, mimo próbkowania, mimo że między momentami pomiaru nic nie ma, informacja jest wystarczająca do pełnego odtworzenia sygnału. Czyli w naszym przypadku, dźwięku.”

    Owszem, bardzo slusznie zauwazono. Tyle ze dokladnie mozna odtworzyc dzwiek o skonczonym spektrum. Zas kazdy sygnal o skonczonym czasie trwania ma neiskonczone spektrum. Gdy zatrabimy na trabie czy nacisniemy klawisz fortepianu a potem pedal, wygenerujemy sygnal o neiskonczonym spektrum. Niby niewielka roznica, ale zawsze.

    Artykul napisany pzrez miskidomleka przedstawia nie „strone lodzka” wynalazku mp3 a strone techniczna. I fajnie. Niektiorych to zainteresuje. Niepotrzebne i wcale nie przysparzajace esejowi pozytywow sa natomiast wycieczki osobiste pod adresem WO. WO pisal o czyms zupelnie innym

  83. miskidomleka 12.8.2011, piątek o 18:21:34

    @mamula66

    Ty masz chyba poważne problemy z czytaniem.

    To nei „notatka”. To esej.
    A kto użył słowa „notatka”?

    Podobnie z artykulem WO. On napisal o czlowieku ktory wymyslil MP3 i o tym jak do tego doszlo. Jak dziala MP3 jest w tym kontekscie zupelnie obojetne.
    Owszem, raczej jest. Problem z WO jest taki, że on napisał, jak działa MP3, i napisał to źle. I o tym jest większość dyskusji w komentarzach powyżej.

    Gdy zatrabimy na trabie czy nacisniemy klawisz fortepianu a potem pedal, wygenerujemy sygnal o neiskonczonym spektrum.
    Odpowiedziałem Ci u Andsola jak to jest z częstotliwościami powyżej 20 kHz.

  84. A.L. 12.8.2011, piątek o 18:49:19

    miskidomleka: „Odpowiedziałem Ci u Andsola jak to jest z częstotliwościami powyżej 20 kHz”

    Neistety, blog andsola jest padniety od niejakiego czasu

    „miskidomleka: ” raz notkę i komcie pod nią”

    Ja: Ktora notke?

    miskidomleka: A kto użył słowa „notatka”?”

    taki sam poziom czepianai sie jak czepianei sie WO

    miskidomleka: „Owszem, raczej jest. Problem z WO jest taki, że on napisał, jak działa MP3, i napisał to źle. I o tym jest większość dyskusji w komentarzach powyżej.”

    To nie powod zeby napastowac WO. Z punktu widzenia celow artykulu WO i poblicznosci do ktorej artykul byl adresowany neiscislosci sa bez znaczenia. Mnie nie chodzi o tresc „notki” ale o „ton”.

    Tak na marginesie, czy „miskodompela” tak dokaldnie opisal dzialanie MP3? Moze troche poanalizujemy :)

  85. miskidomleka 12.8.2011, piątek o 19:24:35

    blog andsola jest padniety od niejakiego czasu
    To poczekaj aż wstanie.

    To nei „notatka”. To esej.
    A jaki to jest poziom czepiania się? Poziom grożący banem.

    To nie powod zeby napastowac WO.
    To twoja opinia, najwyraźniej zbieżna z opinią WO. Moja (i paru innych osób) jest taka, że należy albo pisać dobrze, albo wcale. I że nieścisłości nie są bez znaczenia.

    Mnie nie chodzi o tresc „notki” ale o „ton”.
    Jak ci się nie podoba, nie musisz czytać. Mnie się nie podoba ustawiczne przekręcanie mojego nicka przez ciebie, twój ton też mi się nie podoba, więc uważaj, bo jeszcze trochę, a już nie będziemy cię tu czytać.

    tak dokaldnie opisal dzialanie MP3
    Jejku, wróć do szkoły podstawowej i przetrenuj czytanie. Przecież nie chodziło o „dokładnie”, chodziło o to, żeby przekazać główny koncept stojący za MP3, czyli zastosowanie modelu psychoakustycznego. A nie, jak WO, opowiadać (błędnie) o próbkowaniu, które do zrozumienia MP3 nie jest potrzebne.

  86. wo 14.8.2011, Niedziela o 4:28:44

    @miskidomleka
    ” Moja (i paru innych osób) jest taka, że należy albo pisać dobrze, albo wcale. I że nieścisłości nie są bez znaczenia”

    A moja – na wszelki wypadek to zaznaczę, bo skoro Ty swoją przedstawiasz wielokrotnie, to ja też mogę chyba po raz drugi? – jest taka, że to nierealizowalny postulat. O czymś zawsze wyrazisz się nieściśle, bo pisanie wymaga określenia głównego tematu i na tym temacie masz ustawioną ostrość. Tak jak w fotografii, pewne detale wypadną poza głębię ostrości i to dobrze, bo kiedy zdjęcie ma przedstawić, powiedzmy, jakiegoś kwiatka, przesadnie ostra ekspozycja wszystkich elementów tła wcale nie zrobi z niego lepszego zdjęcia.

    Zatem: moja teza jest taka, że Twój postulat, przy całej swojej zacności, ma ten zasadniczy feler, że jest nierealizowalny. I to jest dopiero miejsce, w którym wszelka dyskusja grzęźnie, bo Ty gołosłownie twierdzisz, że jesteś przekonany o jego realizowalności, ale „nie będziesz za mnie odwalał roboty”. To trochę tak jak internetowe dyskusje o budowie dróg i mostów, kiedy komcionauta wyskakuje z tekstem typu „my ze szwagrem byśmy to lepiej zrobili i nie obchodzi nas trucie inżynierów, że inaczej się nie dało ze względów technicznych – przecież nie będziemy za tych inżynierów odwalać roboty”.

  87. miskidomleka 14.8.2011, Niedziela o 10:46:33

    Oj, znowu zaczynamy? Bo przesz ja się powtórzyłem tylko na potrzeby mamuli/A.L. który najwyraźniej wziął się z komentowanie nie przeczytawszy dyskusji..

    A metafora z głębią ostrości jest marna, choćby dlatego, że rzecz nieostra jest przedstawiona zgrubnie, a nie jako zupełnie inna. Pomijając już różnice w percepcji zdjęcia i tekstu.

    @odwalanie roboty
    Wiesz, jakbym miał do czynienia z kim innym, to może bym się i postarał przepisać odpowiednie kawałki Twojego tekstu na moją modłę – tak, żeby nie rozmieniając się na szczegóły nie napisać bzdur. Ale wymagałoby to sporego wysiłku, bo zawodowo piszę zupełnie innym stylem. Co ważniejsze, mam jakieś takie dziwaczne i nie wiem skąd biorące się przeczucie, że nawet gdybym to napisał pięknie, zgrabnie, mądrze i bez błędów, miałbyś poważne kłopoty z uznaniem, że się dało.

  88. A.L. 14.8.2011, Niedziela o 10:53:43

    miskidomleka: „To twoja opinia, najwyraźniej zbieżna z opinią WO. Moja (i paru innych osób) jest taka, że należy albo pisać dobrze, albo wcale. I że nieścisłości nie są bez znaczenia.’

    No fajnie.

    :”Twierdzenie to mówi nam (w wersji udelfinionej na nasze potrzeby), że sygnał zawierający składowe (znów Fourier się kłania) o częstotliwościach nie większych niż B może zostać wiernie zapisany za pomocą próbkowania z częstotliwością próbkowania 2B. Wiernie – czyli mózg nic nie musi dopowiadać, mimo próbkowania, mimo że między momentami pomiaru nic nie ma, informacja jest wystarczająca do pełnego odtworzenia sygnału. Czyli w naszym przypadku, dźwięku.”

    No wlasnie. Niescislosci nei sa be z znaczenia.

    Twierdzenie NKS mowi tylko ze dkonadnie mozna odtworzyc tylko sygnal skladajacy ze ze skonczonej ilsoci sinusoid trwajacych nieskoncenie dlugo. Dla sygnalu trwajacego skonczony czas juz tak dobrze nie ma. Proponuje wizac sygnal zlozony z na przykald 20 okresow pojedynczej sinusoidy i rozlozyc go w szereg Fouriera. Okazuje sie ze bedzie nieskonczenie wiele wyrazow. Oczywiscie, nie mozemy manipulowac w komputerze (o ile nie jest to maszyna Turinga) neiskonczona iloscia danych,wiec musimy wziac skonczona ilosc wyrazow szeregu.

    Proponuje wykonac eksperyment obliczeniowy polegajacy na sumowaniu N pierwszych wyrazow szeregu. Okazoje sie, ze czym wiecej wyrazow wezmiemy, tym blizszy bedzie wykles otrzymanej funkcji do funkcji oryginalnej. Mowimy ze ow proces „zbiezny”. Tyle tylko ze… Ow proces, jak matematycy mowia jezt zbiezny „sredniokwadratowo”. Ale okazuje sie ze nie jest, jak matematycy mowila „jednostajnie zbiezny”. Objawem tego jest pojawienie sie oscylacji ktorych amplituda jest tym wieksza im wiecej wezmiemy pod uwage wyrazow szeregu Fouriera, a wiec tym wieksze sa owe oscylacje im bardziej staramy sie byc dokaldni. Ten efekt nosi nazwe „zjawiska Gibbsa” (Gibbs phenomenon). Tak wiec z tym „dokladnym odtwarzaniem” nie calkiem tak jest.

    Nadodatek, sprawa techniczna” – nei da sie do glosnika (tak, tak, wim, przez wzmacniacz) wyslac „probek”. Z tych probek tzreba odtworzyc ciagly sygnal. Tego odtrworzenia dokonuje pzretwornik cyfrowo-analogowy, ktorego istotnym elementem ejst „ekstrapolator” ktory „dorabia” wartosci sygnalu meidzy probkami. W efekcie, jezeli dokonamy dyskretyzacji (nawet bez kwantyzacj) a potem odtwozrenia, otrzymamy INNY sygnal nie na wejsciu. Dlatego CD brzmia inaczej niz plyta winylowa. I dlatego urzadzenia elektroakustyczne bez elementow cyfrowych brzmia lepiej niz urzadzania z takowymi.

    Wiec nawoluja autora blogu aby postudiowal elektronike zanim zacznie pouczac innych w tym zakresie.

  89. kwik 14.8.2011, Niedziela o 11:31:33

    @ A.L – możliwe, nie znam się, ale tak czy owak Brandenburg kompresował już zdigitalizowany zapis z cederoma, więc rzecz jasna chodziło mu o uzyskanie efektu zbliżonego do CD (a nie nieznanego oryginału, bo to zwyczajnie niemożliwe). A zaprezentowane przez WO pod tytułem „Jak oszukać ludzkie ucho?” wyjaśnienia są zupełnie od czapy i jeszcze lepszy jest tylko komentarz mamuli66: „jak dziala MP3 jest w tym kontekscie zupelnie obojetne”.

    @ miskidomleka – najwyraźniej nie rozumiesz o co chodzi w pisaniu. Chodzi o rezonans, żeby to co autor pisze podobało się jak największej liczbie czytelników. Metafora z głębią ostrości czyli „bokeh Orlińskiego” to polska szkoła rzetelnego dziennikarstwa, „pisząc o Paryżu nie pisz, że stolica Anglii”, ale poza tym hulaj dusza, możesz napisać dowolne brednie, przecież nikt nie sprawdzi. I nie jest to wcale wina Orlińskiego, na jego miejscu też miałbym w dupie.

  90. wo 14.8.2011, Niedziela o 13:53:22

    @miskidomleka
    „A metafora z głębią ostrości jest marna, choćby dlatego, że rzecz nieostra jest przedstawiona zgrubnie, a nie jako zupełnie inna. Pomijając już różnice w percepcji zdjęcia i tekstu”

    Po prostu nie chcę przynudzać, więc ciągle wymyślam inny przykład. Poprzedniego nie zaszczyciłeś odpowiedzią – użyłem przykładu tekstu o szwedzkiej mniejszości w Finlandii. Wyobraźmy sobie, że znajdzie się w nim wzmianka „Linus Torvalds, twórca systemu operacyjnego Linux”. Ta wzmianka będzie nieścisła i wprowadzająca w błąd, bo Linux (zwłaszcza rozumiany jako „to, czego twórcą jest Torvalds”) to nie jest system tylko kernel. Cały system bierze elementy z innych darmowych Uniksów, przede wszystkim z projektu GNU, więc ściślej byłoby mówić „GNU/Linux” – i tak dalej, na sam ten temat osoba o Twoim charakterze mogłaby napisać notkę pięć razy dłuższą od tej o MP3.

    Przypominam, że tematem tekstu nie są systemy operacyjne tylko antropologia kultury. Czy miałoby sens unikanie nieścisłości przez obdarzenie Torvaldsa dwuakapitowym wyjaśnieniem tego galimatiasu? Żeby w ogóle wytłumaczyć zdanie „nie system tylko kernel”, trzeba by wyjaśniać czytelnikom, co to jest kernel. Czy to ma sens?

    A z drugiej strony: czy w tekście o szwedzkiej mniejszości w Finlandii należałoby odpuścić sobie tak smakowity przykład (zwłaszcza pasujący do niezbędnego akapitu, że z tej mniejszości wywodzi się ponadprzeciętnie wielu pisarzy, intelektualistów i wynalazców, którzy rozsławili Finlandię na świecie), tylko dla obsesyjnego unikania nieścisłości?

    Moja odpowiedź jest taka, że należy się pogodzić z tym, że tekst o szwedzkiej mniejszości w Finlandii nie jest podręcznikiem informatyki i można w nim nieściśle wyrazić się o Linuksie. Odwrotnie zresztą, podręcznik informatyki nie jest tekstem o etnografii i można sobie odpuścić wnikanie w etniczne powikładnia Torvaldsa i beztrosko nazwać go „Finem” (choć to nieścisłe i wprowadzające w błąd).

    Jak podszedłbyś ze swoim „unikać nieścisłości” do powyższego problemu? Odpowiesz beztrosko, że na pewno się da, chociaż nie wiesz jak, ale nie takie problemy wy ze szwagrem rozwiązywaliście?

    @kwik
    „polska szkoła rzetelnego dziennikarstwa”

    Bardzo się mylisz, jeśli Ci się wydaje, że powyższy problem jest przypisany tylko do języka polskiego. Natrafisz na niego w każdym języku, chcąc napisać tekst o szwedzkiej mniejszości w Finlandii.

  91. miskidomleka 14.8.2011, Niedziela o 14:44:25

    @wo
    Za mało wiem o narodzinach Linuksa, by o tym rozmawiać. Z tego co widzę (głównie z Twojego komentarza), Torvalds był twórcą kernela, czyli części systemu, więc widzę możliwość użycia słowa „współtwórca” lub może lepiej „twórca kluczowego składnika/elementu”, coś w tym guście. Ale jedziesz analogiami jak ksiądz na kazaniu. Próbkowanie nie było nawet w luźnym zbokehowanym przybliżeniu tym, co wymyślił i zrobił Brandenburg. Nie było też częścią wynalazku Brandenburga, ani częścią próbkowania nie był wynalazek.

    @A.L.
    A bardzo dziękuję, moje uwagi do skrzypków i matematyków w tekście notki były na serio, chętnie czegoś się douczę.
    Więc żebym się porządnie douczył, zechcesz mi rozjaśnić jeszcze kilka spraw?
    Z tego co widzę, zjawisko Gibbsa dotyczy rozkładu fourierowskiego funkcji (sygnału ciągłego, niedyskretnego) i tego, co się dzieje w punkcie nieciągłości. W jaki sposób dotyczy reprezentacji sygnałów dyskretnych, gdzie nie może być chyba mowy o punkcie nieciągłości?

    Jeśli możliwy jest sygnał dyskretny którego fourierowska reprezentacja w dziedzinie częstotliwości jest niekompletna, czy możesz podać taki sygnał? Czy możesz podać ciąg d o długości n (dla ułatwienia życia algorytmom przyjmijmy n=2^m gdzie m jest naturalne) zawierający wartości z przedziału 0..1 taki, że ciąg operacji w Matlabie:
    df=fft(d,n);
    c=ifft(df);
    k=max(abs(c-d))
    da k większe niż liczba rzędu 10^-15, czyli większe niż błądu związany z reprezentacją liczb zmiennoprzecinkowych podwójnej precyzji?

    Tego odtrworzenia dokonuje pzretwornik cyfrowo-analogowy, ktorego istotnym elementem ejst „ekstrapolator” ktory „dorabia” wartosci sygnalu meidzy probkami.
    Nie ekstrapolator, tylko zwykły filtr dolnoprzepustowy. Filtrów dolnoprzepustowych (jawnych i niejawnych) masz i tak sporo w każdym torze czysto analogowym.

    . I dlatego urzadzenia elektroakustyczne bez elementow cyfrowych brzmia lepiej niz urzadzania z takowymi.
    Powiedziałm Ci u Andsola, nie będę rozmawiał o religii. Wróć z wynikami odpowiednio starannnie przeprowadzonego i udokumentowanego podwójnie ślepego odsłuchu, oczywiście wynikami jednoznacznie wspierającymi Twoje tezy, wtedy będziemy rozmawiać.

  92. kwik 14.8.2011, Niedziela o 15:19:17

    @ wo – stawiasz zasłonę dymną, przecież nie idzie o język i jakiś niuans ontologiczny tylko zasadniczo błędne tłumaczenie „jak oszukać ludzkie ucho” w tekście jak na złość właśnie tak zatytułowanym (podejrzewam więc, że nie Ty ten tytuł spłodziłeś). Miskidomleka poza tym niepotrzebnie czepia się pierdół, ale tu ma 100% racji, nie odrobiłeś pracy domowej (i co gorsza nikt nie sprawdził). Dlaczego nie umiesz się przyznać, przecież Twoja reputacja na tym nie ucierpi, wręcz przeciwnie.

  93. miskidomleka 14.8.2011, Niedziela o 15:22:54

    @kwik
    do poprzedniego Twojego komentarza. Zbieżność poglądów A.L. i mamuli66 jest wysoce nieprzypadkowa.

  94. andsol 14.8.2011, Niedziela o 15:29:36

    A.L. to mamula. A raczej „mamula66” jest A.L.’em, ale zapomniał powiedzieć o sięrozdwojeniu.

  95. kwik 14.8.2011, Niedziela o 15:35:17

    @ miskidomleka, andsol – ale przecież to już on sam powinien powiedzieć, inaczej jest niegrzecznie. No i kładziecie mój żarcik.

  96. andsol 14.8.2011, Niedziela o 15:39:37

    kwik: pełen-m skruchy. Jak chcesz, to napiszę jakiś żarcik, żebyś i Ty miał co wyłożyć.

  97. andsol 14.8.2011, Niedziela o 15:42:21

    kwik, gotowe (u mnie). Możesz mu przyłożyć.

  98. wo 14.8.2011, Niedziela o 16:49:59

    @miskidomleka
    „Za mało wiem o narodzinach Linuksa, by o tym rozmawiać. ”

    Nie potrzebujesz tej wiedzy, bo pytanie brzmi „czy Linux to system operacyjny”. Dawaj, tak czy nie. Prosta sprawa, mógłbyś się zdecydować.

    „czyli części systemu, ”

    Części JAKIEGO systemu? Konkretną odpowiedź poproszę. Jak nazywasz system, którego kernelem jest Linux?

    „Próbkowanie nie było nawet w luźnym zbokehowanym przybliżeniu tym, co wymyślił i zrobił Brandenburg”

    No tak, teraz dotarła do mnie istota Twoich zarzutów – po prostu potem już nic nie było o tym, żeby Brandenburg coś w ogóle innego wynajdował albo robił. Fakt, jak teraz spojrzałem na ten tekst, rzeczywiście wygląda to okropnie. Zaczynam od „co wynalazł Brandenburg?”, potem „próbkowanie!”. I więcej już nic nie ma. W sumie zdumiewające, jak mi się udało tak długo pisać tylko i wyłącznie o próbkowaniu, sam Zaremba mógłby u mnie brać korepetycje z lania wody.

    @kwik
    „w tekście jak na złość właśnie tak zatytułowanym ”

    Nieścisłość, nieścisłość! Tytuły są dwa.

    ” Dlaczego nie umiesz się przyznać, przecież Twoja reputacja na tym nie ucierpi, wręcz przeciwnie.”

    Ależ ja się przyznaję do uproszczeń! Wyjaśniam tylko cel, dla którego je wprowadziłem. Wyjaśniam też, dlaczego postulat Miskidomleka, by pisać zawsze bez nieścisłości, jest nierealizowalny. Staram się w tych wyjaśnieniach być maksymalnie łopatologiczny i – jak widzę – są osoby, do których te wyjaśnienia dotarły. A że nie dotrą do wszystkich, no trudno, nie wszystko musi być zrozumiałe dla wszystkich.

  99. kwik 14.8.2011, Niedziela o 17:15:17

    @ wo – ok, dajmy spokój. Oczywiście masz rację, nie da się pisać bez uproszczeń i nieścisłości, pytanie jak dużych. Być może w pewnych okolicznościach zamiast w dół można napisać w górę, kierunek się przecież zgadza, ale muszę się jeszcze oswoić z tą myślą.

  100. wo 14.8.2011, Niedziela o 17:38:11

    @kwik
    „Być może w pewnych okolicznościach zamiast w dół można napisać w górę, ”

    No pewnie! Ale zadaniem piszącego jest ustalenie, gdzie i jak upraszczać, a gdzie i jak uszczegółowić – tak jak fotograf podejmuje decyzję o głębi ostrości. Na przykład bardzo mocno podkręcam ostrość tam, gdzie piszę o owym błędzie kompilatora. Gdy się przygotowywałem do podróży do Erlangen i Ilmenau, znalazłem relacje mówiące o samym błędzie, ale nigdzie nie znalazłem informacji o tym, na czym ten błąd konkretnie polegał. Dlatego tutaj podkręciłem ostrość detalu na maksa bo uznałem, że detal, którego nie ma w byle Wikipedii, zasługuje na wyeksponowanie.

    Natomiast wszędzie tam, gdzie zainteresowany może sobie niezbędne detale w trymiga wyguglać, nie bawilem się w podkręcanie ostrości, bo – srsly – po cholerę.

  101. fizyk 16.8.2011, wtorek o 2:46:04

    @wo
    „Napisałeś – cytuję ponownie – „Nie wiem dlaczego dziennikarze tak robią, mogę się jedynie domyślać”. To zdanie wyraźnie sugeruje, że uważasz, że tak właśnie robią. Najpierw więc tworzysz sobie jakąś własną fantasmagorię, a potem na jej bazie tworzysz dalsze konfabulacje. To bardzo charakterystyczne dla tego typu „przeciwników wprowadzania w błąd”, przeważnie sami nie są świadomi tego, jak bardzo bełkotliwe i mętne są ich własne wypowiedzi. I strasznie się zaperzają, gdy im się to zademonstruje przez cytowanie ich własnych słów.”

    Napiszesz wreszcie coś w temacie, czy będziesz dalej przypisywał mi bycie „tego typu przeciwnikiem”? Wycieczki personalne zostaw sobie na swojego bloga i do swojej gazetki. Odpowiadam ci ostatni raz.

    Do tego wszystkiego wrednie manipulujesz i kłamiesz. Cytujesz zdanie wyrwane z kontekstu. Zacytuję pełną moją wypowiedź w tej kwestii:
    „Dokładnie tak to wygląda post factum. Nie wiem dlaczego dziennikarze tak robią, mogę się jedynie domyślać (czas, kasa, wymogi rynku, etc.).”

    Jeśli nie zrozumiałeś tego co napisałem, to wcale się nie dziwię, że nie rozumiesz dlaczego popełniłeś błędy w tekście o MP3. Jednocześnie sposób manipulacji mojej wypowiedzi potwierdza tylko to, że „dziennikarze tak to robią”. Rób sobie tak dalej.

    EOT, bo widzę, że mam do czynienia z trollem. Nie będę dalej karmił.

  102. wo 16.8.2011, wtorek o 5:02:22

    @fizyk
    „Napiszesz wreszcie coś w temacie,”

    Wszystkie moje wypowiedzi „są w temacie” (co za polszczyzna, Chryste Panie) uproszczeń w tekście o MP3. Jeśli tego nie zauważyłeś czy też nie zrozumiałeś, to wcale się nie dziwię, że za sprawą słabego opanowania języka polskiego odnosisz jakieś błędne wrażenia. Smutne, że do swoich fantasmagorii dobudowujesz konfabulacje, ale hej, nie takie ciekawostki można spotkać w interwebsach.

  103. bantus 26.8.2011, piątek o 9:35:23

    Mam nadzieję, że dotrzymasz słowa i napiszesz o tych wszystkich 24bit/96kHz. Co jakiś czas wychodzą audiofilskie wydania moich ulubionych płyt i #samaniewiem. Z jednej strony ktoś to produkuje, a ktoś inny kupuje, za odpowiednią cenę rzecz jasna, a z drugiej argumenty, że przecież oni w zimę śniegiem handlują, tudzież cukier jako lekarstwo sprzedają. Przeważnie nie kupuję, ale czasem korci.

  104. miskidomleka 26.8.2011, piątek o 16:37:05

    Postaram się. Trochę zarobiony jestem. Poza tym jeśli już, mam chyba większą ochotę na pisanie o decybelach niż o kilohercach i bitach ;-)

  105. kreska_ 5.2.2013, wtorek o 22:28:56

    derkacz dyrdymały degrengolada – czemu nie było nic na „jeśli przebrniesz przez wszystkie komentarze”? :P

    Szkoda, że już ponad rok od dyskusji. Tylko jedno – uproszczenia, uproszczeniami, ale… wkładać je w cudze usta (a już zwłaszcza samego wynalazcy, którego wynalazek polegał ponoć jednak na czymś innym)?

  106. kreska_ 5.2.2013, wtorek o 22:29:47

    A jeszcze – dzięki komentarzom przypomniało mi się to: http://www.youtube.com/watch?v=0c-sGm9dE2Q, więc serdecznie dziękuję.

%d blogerów lubi to: