Warum kann man Musik über eine Telefonleitung nicht gut hören?
Diese Frage wurde mir in einem Vorstellungsgespräch für ein Studienpraktikum gestellt und ich hatte leider keine Ahnung.
Mir wurde der Hinweis gegeben, dass die Telefonabtastrate 8000 Abtastungen pro Sekunde beträgt.
Der Hinweis des Interviewers ist ein Ablenkungsmanöver. Die Einschränkung, die Sie hören, war schon lange Teil des Telefonnetzes, bevor digitales Sampling eine Rolle im Telefonsystem spielte. Und es gilt sogar bei einem Ortsgespräch, bei dem das Signal niemals digitalisiert wird.
Es hängt damit zusammen, dass die Verbindung von einem Festnetztelefon in Ihrem Haus oder Büro zurück zur „Zentrale“ der Telefongesellschaft im Wesentlichen eine kontinuierliche Verbindung über ein Paar Drähte ist. In der Regel sind keine aktiven Schaltkreise wie Verstärker, Repeater, Digitalisierer oder andere elektronische Komponenten beteiligt.
Angesichts der Technologie von vor 100 Jahren, als das Telefonnetz zum ersten Mal entworfen wurde, konnte eine Verbindung dieser Länge wirklich nur eine sehr begrenzte Bandbreite übertragen. Die Ingenieure, die das Netzwerk entworfen haben, führten zahlreiche Experimente durch, um festzustellen, welche Frequenzen übertragen werden mussten, damit die Menschen die normale Sprache des anderen verstehen konnten, und konstruierten das Netzwerk nur, um sicherzustellen, dass diese Frequenzen übertragen wurden. Sie fügten dem System keine kostspieligen Komponenten hinzu, wenn sie nicht benötigt würden, um dieses Ziel zu erreichen.
Zum Beispiel könnten sie passive Filter verwendet haben, um hohe Frequenzen in Schaltkreisen zu "betonen", die etwas länger als der Durchschnitt waren (und daher dazu neigen, die hohen Frequenzen natürlicherweise zu unterdrücken), oder um hohe Frequenzen in Schaltkreisen abzuschneiden, die kürzer als der Durchschnitt waren. um sicherzustellen, dass alle Benutzer möglichst die gleiche Verbindungsqualität erhalten.
Später, als sie anfingen, Multiplexing zu verwenden, um mehrere Sprachleitungen über ein einziges Kabel zu verbinden (z. B. für Verbindungen zwischen Städten), erlaubte ihnen die begrenzte Bandbreite, mehr Verbindungen über ein einziges Kabel zu führen, und an diesem Punkt hätte die Bandbreitenbeschränkung zugenommen wurde bewusst durch Filterung erzwungen, um sicherzustellen, dass sich die Gespräche nicht gegenseitig übersprechen.
Als schließlich digitales Sampling und digitale Übertragung in das Netzwerk eingeführt wurden, kamen die in den anderen Antworten diskutierten Einschränkungen des Sampling-Theorems ins Spiel. Glücklicherweise ermöglichten die Bandbreitenbeschränkungen, die in den frühen Tagen der analogen Telefonnetze eingeführt wurden, die Digitalisierung mit wirklich niedrigen Bitraten, ohne die Signalqualität unter das Niveau der ganzen Zeit zu verschlechtern, und dies wiederum ermöglicht es, mehr Gespräche über eine bestimmte Leitung zu führen das Netzwerk.
Bearbeiten
Ich möchte mit einem wichtigen Punkt zusammenfassen, den ich zuvor in einem Kommentar zu einer anderen Antwort gepostet habe:
Die in der digitalen Telefonie verwendete digitale Abtastrate (und später die Komprimierungsverfahren) wurde so gewählt, dass sie den Eigenschaften des analogen Telefonnetzes entspricht, nicht umgekehrt.
Laut Wikipedia liegt der Frequenzbereich des einfachen alten Telefondienstes zwischen 300 Hz und 3,4 kHz. Bei jeder Musik, die Sie hören, fehlen also die niedrigen Frequenzen und die hohen Frequenzen. Wenn Sie sich an das letzte Mal erinnern, als Sie Wartemusik am Telefon gehört haben, werden Sie sich wahrscheinlich daran erinnern, dass es etwas dumpf klang, aber ich muss sagen, dass es immer noch erkennbar ist, dh Sie können erkennen, welche Musik gespielt wird. Ich würde mich ärgern, wenn meine Hi-Fi-Anlage so klingen würde, aber die Musik ist nicht völlig verstümmelt.
In meiner Jugend war ich ein HiFi-Enthusiast, und die technischen Daten der Hersteller rühmten sich, dass ihre Geräte ein flaches Frequenzspektrum von etwa 20 Hz bis 20 kHz hätten. Das Problem bei der Reproduktion in einem Telefonsystem besteht darin, dass, wie DisplayName in ihrer Antwort erwähnt, eine Frequenz übertragen wird über ein digitales Netzwerk erfordert eine Abtastfrequenz von mind Andernfalls erhalten Sie Aliasing . Das Bereitstellen von Bandbreite kostet Geld und verringert die Anrufkapazität (dh weniger Anrufe pro Glasfaser), sodass Telefon-Backbones eine Abtastfrequenz von nur 8 kHz verwenden und daher die höchstzulässige Frequenz 4 kHz beträgt. Die Obergrenze ist etwas niedriger, da es schwierig ist, Audiofilter mit sehr scharfen Cutoffs zu entwickeln. Die oben erwähnte 3,4-kHz-Grenze soll vermutlich sicherstellen, dass keine Frequenz in der Nähe von 4 kHz durchkommt.
Ob für die Musikwiedergabe ein so großer Frequenzbereich benötigt wird, ist fraglich. Bei einem kürzlichen Hörtest wurde mir gesagt, dass ich nichts über 12 kHz hören kann (zu viele Black Sabbath-Gigs in meiner Jugend), aber Musik auf meiner Hi-Fi-Anlage klingt für mich immer noch gut.
Schauen Sie sich das Nyquist-Theorem an. Die Abtastfrequenz muss mindestens doppelt so hoch sein wie die Abtastfrequenz. Dh deshalb kann das menschliche Ohr bis ca. 20 kHz und die CD-Samples bei 44,1 kHz.
Wikipedia Nyquist-Shannon-Theorem
Was hören wir stattdessen, wenn wir (ursprünglich) 5 Hz bis 20 kHz Musik über das Telefon hören? Ist alles über 8 kHz einfach weg oder gibt es noch einen anderen Effekt? Werden zB 14 kHz bei 7 kHz irgendwie (aber anders) hörbar sein?
Oder anders gesagt: „Was passiert mit den Frequenzen, die über der Nyquist-Schwelle liegen?“
Die Frequenzen fehlen. So einfach ist das. Nicht anwesend. Was unser Ohr stattdessen tut, ist, sich zu merken, was da sein sollte, basierend auf Erfahrung. Wenn Sie also mit jemandem sprechen, wissen Sie, dass Ihr Gehirn am Telefon hinzufügt, was da sein muss. Trotzdem bemerkte ich, dass mein Gehirn mir beim ersten Mal die wahren Informationen (fehlende Frequenzen) gab und erst später erfuhr, dass es den Rest nur vortäuschen kann, basierend auf dem Wissen um die Stimme des Gegners. Siehe Wikipdedia:CELP , das einen ähnlichen Ansatz für die Audiokomprimierung verwendet.
Wenn Sie mehr über die Gründe der 8-kHz-Abtastrate erfahren möchten, können Sie wieder Wikipedia verwenden: Wikipedia: PSTN Der verwendete Standard ist G.711 . Auch Sampling Frequency und Human Speech , die ich noch nicht gelesen habe, gehen auf das ein, was Sie als Minimum für menschliche Sprache benötigen, einschließlich Grafiken und Erklärungen. Schließlich können Sie in Wikipedia:MP3 nachsehen , um die Psychoakustik zu verstehen. Hint a beat maskiert zum Beispiel Dinge, die danach kommen. So kann das Zeug fallen gelassen werden, da man es nicht hört und andere nette Dinge. :D
Dies liegt an der Signalverarbeitung, nicht an der Physik. Telefonanbieter wenden eine aggressive Komprimierung an, die dafür optimiert ist, nur Sprache gut aufzuzeichnen. Der noch verwendete AMR- Codec stammt aus dem Jahr 1999 und erreicht bis zu etwa 13 kbit/s. Auch jeder andere Codec würde mit dieser Bitrate keine gute Musik aufnehmen. Auch MIDI verbraucht mehr Daten.
Telefongesellschaften haben das Telefon nur für die Übertragung von Sprachfrequenzen gebaut. Bass- und Hochtönerfrequenzen liegen im Allgemeinen außerhalb des Bereichs dessen, wofür die Telefone gebaut wurden. Früher habe ich mir eine Radiosendung angehört, in der, wenn ein Anrufer mit einem lahmen Witz anrief, Grillen gespielt wurden, die der Person am Telefon zirpten. Es dauerte eine lange Weile und einige unangenehme Momente, bis sie herausfanden, dass der Anrufer am Telefon die Grillen nicht hören konnte, Radiohörer jedoch. Also führten sie einen On-Air-Test durch und patchten Grillen auf Telefone und Telefone auf Sendung. Tatsächlich wurden die Grillen fast vollständig vom Telefonsystem blockiert.
Es gibt ein paar verschiedene Gründe. Wenden wir uns nur dem digitalen Kanal zu.
Es wird nur ein bandbegrenztes Signal verwendet. G.711 verwendet eine Abtastrate von 8 kHz, was zu einer nutzbaren Bandbreite von 4 kHz führt, die für die Sprache übrig bleibt. Für Sprachtelefonie ist es ok, für Musik aber fast unbrauchbar. Andere Codecs verwenden andere Bandbreiten, zum Beispiel G.722 (Breitbandtelefonie) verwendet eine Abtastrate von 16 kHz, effektiv nutzbare Bandbreite ~8 kHz. Das klingt viel besser.
Sonderfall findet bei Handy-Codecs statt. Dies sind sogenannte Hybrid-Codecs. Diese Codecs sind hochgradig für die Sprachübertragung optimiert (sog. Hybrid-Codecs). Sie verwenden verschiedene Modelle des Vokaltrakts, die durch stark reduzierte Signalformen Ihrer Stimme angeregt werden. Wenn Sie sich für dieses Zeug interessieren, suchen Sie nach: Baseband-RELP, GSM Fullrate Codec, CELP. Aber Vorsicht: Das ist schweres Zeug.
Unter Verwendung des Nyquist-Theorems übertragen Telefone nur Frequenzen, die die Hälfte der Abtastrate haben, die als korrekte Nyquist-Frequenz bezeichnet wird. Bei einer Abtastrate von 8000 Samples pro Sekunde werden also nur Töne mit einer Frequenz von weniger als 4000 Hz korrekt übertragen.
Die Grundfrequenz (die Tonhöhe, die Sie hören) der menschlichen Stimme liegt im Bereich von 80 bis 1100 Hz. Harmonische Frequenzen (Komponentenfrequenzen mit einer Frequenz von einem ganzzahligen Vielfachen der Grundfrequenz) der menschlichen Stimme können viel höher sein. Daher ist eine Abtastrate von 8000 Samples pro Sekunde ausreichend, um menschliche Stimmen ohne große Probleme zu übertragen (Harmonische können immer noch die Nyquist-Frequenz überschreiten).
Wenn Frequenzen oberhalb der Nyquist-Frequenz übertragen werden, wie beispielsweise bei der Übertragung von Musik , tritt Aliasing auf. Dies verursacht Verzerrungen. Dies ist im Diagramm unten detailliert dargestellt.
Die rote Linie ist das ursprüngliche Signal. Die blauen Punkte stellen Zeiten dar, zu denen Proben des ursprünglichen Signals genommen werden. Die blaue Linie ist das vom Ohr aus der unzureichenden Abtastrate rekonstruierte Signal. Wie Sie sehen können, wurde es gegenüber dem roten Signal verzerrt und hat jetzt eine niedrigere Frequenz; eine Frequenz niedriger als die Nyquist-Frequenz der Abtastrate.
Ich habe einen einfachen Matlab-Code für ein Aliasing-Erlebnis geschrieben.
WARNUNG: Stellen Sie die Lautstärke an Lautsprechern/Headset vor der Ausführung ganz herunter.
% Aliasing in Matlab.
% http://physics.stackexchange.com/questions/104281/why-cant-you-hear-music-well-over-a-telephone-line
fs = 8000 % sampling rate (Hz)
nyquistfrequency = fs / 2 % Nyquist frequency (Hz)
freq = [1000;
2000;
3500; % ^ these frequencies will play fine
4500; % v these frequencies will experience aliasing and distort to a frequency lower than the Nyquist frequency
6000;
7000 ]; % frequencies (Hz)
duration = 1; % duration of signal
numberofsamples = ceil( duration * fs ); % number of samples
sample_times = (1 : numberofsamples) / fs;
[h w] = size(freq);
for i = 1 : h,
currentfrequency = freq(i) % current frequency
simplesound = sin( 2 * pi * currentfrequency * sample_times ); % create sound
wavplay( simplesound, fs ) % play sound
end;
Ingenieur2021
David z