Warum bedeutet mehr Bandbreite bei der digitalen Übertragung eine höhere Bitrate?

Ich verstehe, dass ähnliche Fragen wie diese zuvor auf dieser Website gestellt wurden, die unten aufgeführt sind. Allerdings verwirren mich die Antworten. Wenn ich erkläre, was ich zu verstehen glaube, kann jemand bitte darauf hinweisen, wo ich falsch liege?

Ich beginne mit dem, was ich weiß:

Das Shannon-Gesetz gibt die theoretische Obergrenze an

C n Ö ich s j = B l Ö g 2 ( 1 + S N )

wenn S = N, dann C = B

Als N→∞, C→0

Da N→0, C→∞

Die Nyquist-Formel sagt ungefähr aus, wie viele Stufen benötigt werden, um diese Grenze zu erreichen

C n Ö ich s e l e s s = 2 B l Ö g 2 M

(Wenn Sie nicht genügend Logikebenen verwenden, können Sie sich der Shannon-Grenze nicht nähern, aber durch die Verwendung von mehr und mehr Ebenen werden Sie die Shannon-Grenze nicht überschreiten.)


Mein Problem ist, dass es mir schwer fällt zu verstehen, warum die Bandbreite überhaupt mit der Bitrate zusammenhängt. Mir scheint, dass die Obergrenze der Frequenz, die über den Kanal gesendet werden kann, der wichtige Faktor ist.

Hier ist ein sehr vereinfachtes Beispiel: Überhaupt kein Rauschen, 2 Logikpegel (0 V und 5 V), keine Modulation und eine Bandbreite von 300 Hz (30 Hz - 330 Hz). Es wird ein Shannon-Limit von ∞ und ein Nyquist-Limit von 600 bps haben. Nehmen Sie außerdem an, dass der Kanal ein perfekter Filter ist, sodass alles außerhalb der Bandbreite vollständig dissipiert wird. Wenn ich die Bandbreite verdoppele, verdoppele ich die Bitrate usw.

Aber warum ist das so? Für digitale Übertragung mit zwei Pegeln Bei einer Bandbreite von 300 Hz (30 Hz - 330 Hz) ist das digitale Signal von „0 V“ und „5 V“ eine (ungefähr) Rechteckwelle. Bei dieser Rechteckwelle werden die Harmonischen unter 30 Hz und über 330 Hz dissipiert, sodass sie nicht perfekt rechteckig ist. Wenn es eine Grundfrequenz von mindestens 30 Hz hat (also die "0 V" und "5 V" schalten 30 Mal pro Sekunde), dann gibt es eine gute Menge an Oberwellen und eine schöne Rechteckwelle. Wenn es eine Grundfrequenz von maximal 330 Hz hat, ist das Signal eine reine Sinuswelle, da es keine Harmonischen höherer Ordnung gibt, die es quadratisch machen. Da es jedoch kein Rauschen gibt, ist der Empfänger immer noch in der Lage, die Nullen von den Einsen zu unterscheiden. Im ersten Fall beträgt die Bitrate 60 bps, da die "0V's" und "5V's" schalten 30 Mal pro Sekunde. Im zweiten Fall beträgt die Bitrate maximal 660 bps (wenn die Schwellenschaltspannung des Empfängers genau 2,5 V beträgt) und etwas weniger, wenn die Schwellenspannung unterschiedlich ist.

Dies weicht jedoch von der erwarteten Antwort von 600 bps für die Obergrenze ab. In meiner Erklärung kommt es auf die Obergrenze der Kanalfrequenz an, nicht auf die Differenz zwischen Ober- und Untergrenze (Bandbreite). Kann mir bitte jemand erklären, was ich falsch verstanden habe?

Auch wenn meine Logik auf dasselbe Beispiel angewendet wird, aber FSK-Modulation (Frequency Shift Keying) verwendet wird, bekomme ich das gleiche Problem.

Wenn eine Null als 30-Hz-Trägerfrequenz ausgedrückt wird, eine Eins als 330-Hz-Trägerfrequenz und das Modulationssignal 330 Hz, dann beträgt die maximale Bitrate 660 bps.

Kann bitte nochmal jemand mein Missverständnis aufklären?

Warum überhaupt eine Rechteckwelle verwenden? Warum können wir nicht einfach Sinuswellen senden und die Empfänger so gestalten, dass sie eine Schaltschwellenspannung genau in der Mitte zwischen dem maximalen und minimalen Wert der Sinuswelle haben? Auf diese Weise würde das Signal viel weniger Bandbreite beanspruchen.

Danke fürs Lesen!

Entschuldigung für die sehr schlechte Formatierung, ich habe mir vor dem Posten keine Vorschau angesehen. Ich habe das jetzt behoben.
@Ignacio Vazquez-Abrams, oh okay, das überrascht mich; Ich nahm an, dass es mein Beispiel vereinfachen würde. 5 oder so Oberwellen ergeben normalerweise eine ziemlich anständige Rechteckwelle. Warum sollten Sie also Frequenzen außerhalb der Bandbreite benötigen, um Verzerrungen zu vermeiden?
Anstatt darüber nachzudenken, was mit einem Durchlassbereich von 30-300 Hz passiert, stellen Sie sich vor, was passieren würde, wenn Ihr Durchlassbereich beispielsweise 1,0 bis 1,3 kHz wäre.
@ThePhoton: Ich nehme an, in diesem Fall können Sie keine Oberschwingungen höherer Ordnung haben, denn wenn die Grundfrequenz 1 kHz beträgt, beträgt die 1. Oberschwingung 3 kHz, was weit außerhalb des Durchlassbereichs liegt. Aber das verwirrt mich immer noch. Was wäre der Schaden, wenn nur die Grundfrequenz übertragen würde?
zunächst einige Begrifflichkeiten. Die Grundwelle ist dasselbe wie die erste Harmonische. Wenn die Grundwelle 1 kHz beträgt, dann ist 3 kHz die dritte Harmonische.
Als nächstes überträgt das bloße Übertragen der Grundwelle (oder des Trägers) keine Informationen. Um Informationen zu übertragen, muss der Träger irgendwie moduliert werden. Wenn Sie anfangen, einen Träger ein- und auszuschalten, ist das Spektrum nicht mehr nur eine schmale Linie, es breitet sich aus, je nachdem, wie Sie es modulieren. Wenn Sie ein Durchlassband zwischen 1,0 und 1,3 kHz haben, können Sie Ihren Träger nur mit einem Informationssignal von etwa 300 Hz modulieren und dieses nur verwenden, um Informationen mit der vom SNR bestimmten Rate zu übertragen und die Shannon-Nyquist-Formel.
@ThePhoton: Danke für deine Antwort. Werden die 3 KHz dann nicht die zweite Harmonische sein, da eine Rechteckwelle ein ungerades Vielfaches der Grundwelle ist? Link (verwenden Sie das Zoom-Feld, um die Welle zu sehen).
nein, wir nennen es immer noch die 3. Harmonische. Die n-te Harmonische liegt beim n-fachen der Grundfrequenz. Wir sagen einfach "in einer idealen Rechteckwelle ist keine 2. Harmonische vorhanden."
Es ist eigentlich umgekehrt. Höhere Bitrate bedeutet mehr Bandbreite.

Antworten (3)

Es ist ein subtiler Punkt, aber Ihr Denken geht in die Irre, wenn Sie an einen 330-Hz-Ton denken, der irgendwie 660 Bits/Sekunde an Informationen übermittelt. Das tut es nicht – und tatsächlich vermittelt ein reiner Ton überhaupt keine anderen Informationen als seine Anwesenheit oder Abwesenheit.

Um Informationen über einen Kanal zu übertragen, müssen Sie in der Lage sein, eine beliebige Folge von zu übertragenden Signalisierungszuständen festzulegen , und – das ist der entscheidende Punkt – diese Zustände am anderen Ende unterscheiden zu können.

Mit Ihrem 30-330-Hz-Kanal können Sie 660 Zustände pro Sekunde angeben, aber es stellt sich heraus, dass 9 % dieser Zustandssequenzen gegen die Bandbreitenbeschränkungen des Kanals verstoßen und daher nicht von anderen Zustandssequenzen am anderen Ende zu unterscheiden sind Sie können sie nicht verwenden. Aus diesem Grund ergibt sich eine Informationsbandbreite von 600 b/s.

Durch das Senden von nur 30 Symbolen mit 2 Zuständen pro Sekunde beträgt die Datenrate tatsächlich 30 bps. Nyquist gibt uns Auskunft über die obere Grenze der Datenrate bei gegebener Bandbreite und Anzahl von Zuständen pro Symbol. Die gewählte FSK-Kodierung kommt dieser Grenze nicht nahe, da die gewählten Frequenzen nicht optimal sind. Nyquist sagt, dass wir bessere Frequenzen wählen können.
@le_top: Nur um das klarzustellen, ich habe nicht über FSK-Modulation gesprochen, obwohl das OP es in seiner Frage erwähnt hat. Ich spreche von reiner Basisbandsignalisierung (z. B. zwei Spannungspegel). Ich glaube nicht, dass irgendetwas, was ich geschrieben habe, eine Ablehnung wert war. Können Sie erklären, was Ihrer Meinung nach an dem, was ich geschrieben habe, falsch ist?
* Das Vorhandensein oder Fehlen des 330-Hz-Tons vermittelt Informationen, da sein Vorhandensein als 1 und sein Fehlen als 0 interpretiert werden kann. Die Modulation ist ein/aus. * Die 330 Hz könnten also ohne den 30-Hz-Ton 660 bps-Informationen übertragen. Was in Shannons Formel Rauschen wäre. * Die Verwirrung bestand immer noch, nachdem ich dies gelesen hatte. * Es wird nicht erklärt, dass der Verlust von 9% durch das Nyquist-Abtasttheorem erklärt wird, das besagt, dass das Signal aus genau 2B Abtastungen pro Sekunde perfekt rekonstruiert wird.
* Wenn Sie versuchen, mehr zu tun, treten Aliasing-Effekte auf, daher die Beschränkung auf 2B Symbole gleich der Anzahl der Samples. * 2B Symbole von jedem 1 Bit (2 Zustände) sind 600 bps mit B=300. * 660 Zustände sind möglich, wenn Symbole mindestens 2,2 Zustände darstellen.
@le_top: Ich verstehe wirklich nicht, worauf du damit hinaus willst. Wir haben überhaupt nicht über abgetastete (zeitdiskrete) Systeme gesprochen, daher stellt sich die Frage des Aliasing nie. Was ist Ihr Standpunkt in Bezug auf die vorliegende Frage?
Die Frage bezieht sich auf die Nyquist-Formel ( Cnoiseless=2∗B∗log2M ). Es basiert auf der Tatsache, dass ein Signal mit Bandbreite B aus 2B Samples vollständig rekonstruiert werden kann. Dies führt zu der maximalen Symbolrate, die man in einem Kanal bei gegebener Bandbreite haben kann, was auch gültig ist, wenn nicht abgetastet wird. Wenn nicht, müssen wir schlussfolgern, dass die Nyquist-Formel nicht gilt, weil wir nicht über das Sampling sprechen, aber sie gilt. * Das intermittierende 30-Hz-Signal und das intermittierende 330-Hz-Signal sind beide bandbreitenbegrenzt, was zu Symbol-Aliasing führt [„nicht von anderen Zustandssequenzen zu unterscheiden“]
@le_top Sobald Sie anfangen, es ein- und auszuschalten, ist es kein 330-Hz-Ton mehr, es ist etwas anderes. Wenn Sie etwas anderes analysieren, werden Sie feststellen, dass sich die Bandbreite ändert.
Es ist richtig, dass die meisten Änderungen an einem einzelnen Tonsignal zu einer theoretisch unendlich belegten Bandbreite führen. Selbst ein 300-330 FSK belegt unendlich viel Bandbreite. * Aber das ist bei Nyquist nicht so wichtig. Was wichtig ist, ist die Bandbreite, die wir betrachten/unsere Abtastrate. * Übrigens: Diese Bandbreite ist nicht auf 600 bps begrenzt, sondern auf 600 Zeichen pro Sekunde. Ein Symbol kann mehr als ein Bit übermitteln. * Ein Symbol kann eine Amplitudenänderung oder komplexer sein. * Das Abtasten eines Signals impliziert, dass Sie die Bandbreite des Signals begrenzen - Aliasing von Signalen außerhalb des Bandes.

Dies ist nur eine Teilantwort, aber hoffentlich werden die wichtigsten Punkte angesprochen, die Sie missverstehen.

Mein Problem ist, dass es mir schwer fällt zu verstehen, warum die Bandbreite überhaupt mit der Bitrate zusammenhängt. ...

Wenn eine Null als 30-Hz-Trägerfrequenz ausgedrückt wird, eine Eins als 330-Hz-Trägerfrequenz und das Modulationssignal 330 Hz, dann beträgt die maximale Bitrate 660 bps.

Wenn Sie für eine Null auf 30 Hz herunterschalten, benötigen Sie ungefähr 1/60 s oder so, um wirklich zu wissen, dass Sie 30 Hz und nicht 20 Hz oder 50 Hz oder so etwas haben. In diesem Fall tasten Sie wirklich nur Ihren 300-Hz-Träger ein und aus, und das 30-Hz-Signal, das während der Nullen für 1/660 s gesendet wird, ist nur verwirrend.

Um über FSK zu sprechen, nehmen wir ein realistischeres Beispiel. Angenommen, Sie verwenden 1 MHz für die Null und 1,01 MHz für die Eins. Es stellt sich heraus, dass Sie das Signal etwa messen müssen 1 / 2 Δ f , in diesem Fall 1/20.000 s, um diese beiden Frequenzen zuverlässig unterscheiden zu können. Wenn Sie das Signal nur für 1 us messen würden, könnten Sie den Unterschied zwischen einem 1-MHz-Signal und einem 1,01-MHz-Signal nicht wirklich erkennen (obwohl Sie dies in einem idealen, rauschfreien Szenario tun könnten, genau wie Shannons Formel sagt, dass Sie unendliche Daten mit einer Bandbreite von null übertragen können, wenn das SNR auf unendlich geht)

In diesem Beispiel beträgt die Bitrate, die Sie senden können, etwa 20 kHz, was der 2-fachen Differenz zwischen Ihren 1- und 0-Frequenzen entspricht, genau wie die Nyquist-Formel Sie für einen 2-Level-Code erwarten lässt.

Ihre Fragen sind gültig und der Weg zu einem richtigen Verständnis dessen, was die Theorie bedeutet ;-).

Auf die Frage, wie mehr Bandbreite eine höhere Bitrate bedeutet, mag die Erklärung einfach aussehen, aber gleichzeitig schlecht sein.

Hier ist eine "schlechte" Erklärung, die in Ordnung aussieht. Es ist ein Anfang zu verstehen, warum eine größere Bandbreite mehr Daten bedeutet. Angenommen, ich habe einen ersten WiFi-Kanal Nummer 1, der angesichts der Leistungs- und Codierungsbedingungen mit 1 Mb / s läuft. Dann nehme ich einen anderen WiFi-Kanal Nummer 2, der die gleiche Bandbreite, Leistung und Codierungsbedingungen hat. Es läuft auch mit 1Mb/s. Wenn ich die beiden zusammenzähle, habe ich die Bandbreite verdoppelt (zwei verschiedene Kanäle) und den Datendurchsatz verdoppelt (2x1Mb/s).

Wenn Sie denken, dass dies wie eine perfekte Erklärung aussieht, vergessen Sie, dass wir auch die Leistung verdoppelt haben. Ebenso der doppelte Datendurchsatz durch die doppelte Leistung bzw. durch die doppelte Bandbreite. Es ist eigentlich ein bisschen von beidem.

Wenn ich die Gesamtleistung gleich halte, während ich die Bandbreite verdoppele, muss ich einen ersten WLAN-Kanal, der mit 1 Mb/s läuft, mit der Summe von zwei anderen WLAN-Kanälen vergleichen, die jeweils mit der Hälfte der empfangenen Leistung laufen. Ich werde die Datenblätter von WiFi-Modems nicht überprüfen, aber dies wäre eine interessante Übung, um sie mit dem folgenden theoretischen Ansatz zu vergleichen. Shannon hilft uns bei der Vorhersage, was mehr oder weniger passieren wird, wenn sich die Codierung an die Leistungspegel anpasst (was bei WiFi der Fall ist). Passt sich die Codierung nicht an, bleibt die Datenrate konstant, bis der Empfangspegel zu niedrig wird und dann auf 0 abfällt.

Shannon sagt also: C=B∗log2(1+S/N) . Bei Beibehaltung der Gesamtleistung, aber Verdoppelung der Bandbreite, C2=2*B*log2(1+(S/2)/N), wobei C2 die potenzielle Datenrate ist. Wenn wir die tatsächlichen Zahlen eingeben, könnten wir annehmen, dass S=2xN ist, sodass log2(1+2)=1,58 und log2(1+1)=1. Also C=B*1,58 und C2=B*2 . Mit anderen Worten, wenn mein Signalpegel bei der größten Bandbreite gleich dem Rauschpegel ist, ist die potenzielle Datenrate etwa 26 % höher als die gleiche Gesamtleistung, die bei der Hälfte der Bandbreite abgegeben wird. Theoretisch kann Ultraschmalband also nicht effizienter sein als Ultrabreitband, basierend auf dem Shannon-Theorem. Und das Verdoppeln der Bandbreite bei gleicher Gesamtleistung verdoppelt nicht die Bandbreite, wie unser WLAN-Beispiel nahelegt. Aber die Bandbreite ist höher. Wenn wir den „1“-Term in log2 des Shannon-Ausdrucks vernachlässigen können,

Allerdings muss sich, wie gesagt, die Codierung anpassen, sie muss auf die tatsächlich zur Verfügung stehende Leistung und Bandbreite optimiert werden. Wenn die Codierung gleich bleibt, gehe ich einfach von funktionsfähig zu funktionsgestört.

Um zu Ihrer zweiten Frage zu wechseln, wenn ich ein FSK-Signal habe, das sich bei 30 Hz mit zwei Frequenzen ändert, kann ich nur mit 30 bps emittieren, weil ich 30 Symbole pro Sekunde aussende, die jeweils einem Bit von 1 oder 0 entsprechen. Wenn ich 4 Zustände einführe ( =4 Frequenzen), indem ich zwei Frequenzen zwischen die vorherigen einfüge, weil mein Geräuschpegel es zulässt, dann emittiere ich mit 4x30bps=120bps. Bei FSK glaube ich nicht, dass die Bandbreite konstant bleibt, wenn die Anzahl der Zustände auf diese Weise erhöht wird, aber man kann sicherlich einen Weg finden, sie mehr oder weniger konstant zu halten (unter Berücksichtigung der 3-dB-Grenzen, da das theoretische Frequenzspektrum unbegrenzt ist).

Warum eine Rechteckwelle für das "modulierende" Signal verwenden? Dies ist eine Auswahl bei dieser Codierung, die die Decodierung "einfacher" macht, da Sie auf der Empfängerseite einfach einen Bandpassfilter für jede Frequenz haben müssen. Sie senden immer noch "Sinuswellen" aus - wenn Sie nur "1"-Werte aussenden, haben Sie nur eine Frequenz. Die Frequenzverschiebungen implizieren jedoch das Vorhandensein von "Harmonischen", die diese Frequenzverschiebungen zulassen/begleiten. Andere Kodierungen haben andere Vor- und Nachteile. Beispielsweise ermöglicht Direct Sequence Spread Spectrum ein Signal unterhalb des Rauschpegels (und hat daher in vielen anderen Codierungen einen geringeren Antennenleistungsbedarf für eine ähnliche Bitrate), ist jedoch schwieriger zu decodieren (und erfordert daher mehr (Rechen-) Leistung und Komplexität in der Dekodierungsschaltung).

Was auch immer die gewählte Codierung ist, sie muss das Shannon-Theorem respektieren, das die Obergrenze festlegt. Sie können Shannon nicht einfach auf eine Codierung wie FSK anwenden, wenn Sie den Leistungspegel, die Anzahl der Zustände und andere Parameter des FSK-Signals nicht anpassen, wenn sich der Rauschpegel oder der Signalpegel (Abstand) ändert. Mit Shannon können Sie die absolute Mindestleistung für eine bestimmte Bandbreite und Datenrate überprüfen. Das Codierungsverfahren erhöht die minimale Leistungsgrenze. Und wenn die Leistungspegel diese Grenze überschreiten, bleibt die Bitrate einfach konstant. Die Anwendung von Shannon dort ist einfach falsch, wenn Sie erklären wollen, dass mehr Bandbreite eine höhere Bitrate bedeutet. Das WiFi-Beispiel mag dort in der Praxis sehr wohl für eine Erklärung gelten, aber es ist nicht die allgemeine Antwort auf der Grundlage des Shannon-Theorems.

Bearbeiten: Lesen Sie Ihre Frage erneut: "Im zweiten Fall beträgt die Bitrate maximal 660 bps". Eigentlich verstehe ich nicht ganz, wie Sie auf 660 bps kommen, da sich Ihre Frequenz nur 30 Mal pro Sekunde ändert und Sie auf zwei Frequenzen codieren, was 1 Bit entspricht. Daher meine 30 bps oben. Diese Codierung ermöglicht eine volle Periode bei 30 Hz und 22 volle Perioden bei 660 Hz für jedes Symbol. Aber 22 Perioden ändern nichts an der Tatsache, dass es nur ein Symbol gibt. Es sieht so aus, als ob etwas fehlt oder dass die Argumentation falsch ist.

Edit2: Ich habe es verstanden - Sie vergleichen mit dem Nyquist-Limit. Diese Nyquist-Grenze gibt Ihnen die Obergrenze der Datenrate bei gegebener Bandbreite und der Anzahl der Zustände pro Symbol an. Hier ist die gewählte FSK-Kodierung nicht optimal. Sie verwenden 30 Hz und 660 Hz. Die Nyquist-Grenze besagt, dass 30 bps = 2 * B * log2 (2), daher muss die Bandbreite mindestens B = 15 Hz betragen. Ohne ins Detail zu gehen, heißt es mehr oder weniger, dass das Einstellen der FSK-Frequenzen auf 645 Hz und 660 Hz eine gute Optimierung der Bandbreite wäre (wenn FSK ansonsten eine optimale Codierung ist und ohne die genaue Bandbreite aufgrund von Harmonischen zu überprüfen - die 15 Hz können es auch sein niedrig für FSK).

Bearbeiten 3 - Erklärung folgt nach weiterer Analyse, um die Quelle der Verwirrung mit anderen Antworten und der ursprünglichen Frage weiter zu erklären.

  • Die Nyquist-Formel basiert auf dem Abtasttheorem, das besagt, dass ein Signal mit einer Bandbreite B aus genau 2B Abtastungen pro Sekunde perfekt rekonstruiert wird.
  • Daher können die 2B-Samples jeweils ein Symbol darstellen (die Intensität kann bestimmen, welches Symbol).
  • Ein Signal mit einer Bandbreite von 300 Hz kann mit 600 Symbolen rekonstruiert werden - nicht mehr und nicht weniger.
  • Aus diesem Grund gibt es "Aliasing" - Bandbreitenbeschränkung kann dazu führen, dass zwei verschiedene Signale nach dem Abtasten gleich aussehen.
  • Wenn jedes Symbol nur 2 Zustände repräsentiert, dann sind nur 600 bps möglich.
  • Der FSK von 30 Hz bis 330 Hz kann mehr als 600 bps darstellen, aber dann müssen Sie mehr als 2 Zustände pro Symbol berücksichtigen. Ist aber keine FSK-Demodulation mehr, da man nicht nur die Frequenz berücksichtigen kann.