16-Bit oder 24-Bit Konverter?

Ich möchte einige DSP-Effekte aufbauen, zum Beispiel auf einem STM32F4-Prozessor mit einer Frequenz von 96 oder 192 KHz. Reichen 16-Bit-Wandler (ADC und DAC) für diese Art von Betrieb aus? Kann ich einen Unterschied hören, wenn ich 16-Bit oder 24-Bit wähle?

Was ist die maximale Abtastrate Ihrer ADCs/DACs? Das beeinflusst die Frequenzen, die Sie abtasten möchten. Sie können testen, ob Sie unter Windows einen Unterschied zwischen 16-Bit und 24-Bit hören (Klicken Sie mit der rechten Maustaste auf das Sound-Symbol in der Toolbox -> Wiedergabegeräte -> wählen Sie das verwendete aus -> Eigenschaften -> Erweitert und wechseln Sie zwischen 24-Bit und 16-Bit).
Auf welche Art von Signalen wenden Sie Effekte an und was machen Sie letztendlich mit diesen Signalen?
Ich möchte eine Plattform schaffen, die es mir ermöglicht, viele verschiedene Effekte zu erzeugen. Ich möchte mit Gitarre verwenden. Für den Anfang möchte ich eine einfache ADSR-Hüllkurve machen, aber als nächstes vielleicht etwas wie Delay oder Chorus.
Gitarren haben einen viel geringeren Frequenzgang und Dynamikbereich als andere Audioquellen. 16bit wäre ok.
Sie könnten einen Blick auf die Hoxton-Eule werfen . Ich war zwar nicht besonders begeistert von den Demo-Sounds, die sie auf ihrer Website haben, aber sie haben Schaltpläne und eine Codebasis auf github . Ihre Hardware umfasst einen ARM-Prozessor, einen WM8731 -Codec und einige Kristalluhren. usw.

Antworten (6)

Es hängt davon ab, wen Sie fragen. Die meisten Menschen können nicht über 20 kHz und 16 Bit hinaus hören, also sollten 96 oder 192 kHz ausreichen.

Wie Sie einen Unterschied zwischen 16- und 24-Bit-Wandlern hören, hängt von Ihrem DSP ab. Der Hauptvorteil von 24-Bit-Konvertern besteht darin, dass sie Ihnen jede Menge zusätzlichen Headroom (Dynamikbereich) bieten, sodass Sie viele mathematische Operationen durchführen können, ohne merkliches Quantisierungsrauschen hinzuzufügen.

Nach meiner Erfahrung kann ich keinen Unterschied zwischen 16- und 24-Bit-Konvertern feststellen. Manche Leute glauben, dass sie es können. Wenn ich Sie wäre, würde ich mich für die 24-Bit-Konverter entscheiden, damit Sie sich um eine Sache weniger Sorgen machen müssen und sich auf Ihren DSP-Code konzentrieren können.

Zu diesem Thema gibt es viele schlechte Informationen und Audiophoolerien, aber wenn Sie einen Kanal mit digitalem Audio verwenden, sind 96-kHz- und 192-kHz-Abtastraten albern. Das menschliche Gehör reicht bis 20 kHz. Um Nyquist bei 20 kHz zu erfüllen, benötigen wir eine Abtastrate von mehr als 40 kHz. CDs haben 44,1 kHz und 48 kHz ist eine weitere übliche Abtastfrequenz.

Erinnern wir uns nun daran, dass digitales Audio ein diskretes Signal ist, kein kontinuierliches Signal. Das bedeutet, dass es zu jeder Abtastzeit einen Wert hat und zu allen anderen Zeiten undefiniert ist. Bei einem bandbegrenzten Signal, das bei oder höher als Nyquist abgetastet wird, gibt es nur ein Signal, das durch jede dieser diskreten Abtastungen hindurchgeht. Jedes andere Signal, das alle Abtastpunkte durchläuft, kann Nyquist nicht genügen. Der einzige Grund, für einen einzelnen Kanal mit 96 kHz oder 192 kHz abzutasten, ist, wenn Sie mit einem ADC mit geringer Bittiefe überabtasten. Das ist auch albern, und wir werden als nächstes dorthin gehen.

Wir haben gerade besprochen, wie eine Reihe diskreter Abtastwerte genau zu einem Signal passt. Dies ist unabhängig von der Bittiefe. Das bedeutet nicht, dass die Bittiefe keine Rolle spielt. Die Umwandlung in digital führt Quantisierungsrauschen ein. Quantisierung ist Rauschen, das in das digitale Signal eingeführt wird, indem es auf den nächsten digitalen Wert "gerundet" wird, wie in diesem Bild gezeigt, das schamlos aus Wikipedia gestohlen wurde .

Geben Sie hier die Bildbeschreibung ein

Quantisierungsrauschen steht in direktem Zusammenhang mit der Bittiefe. Es sollte ziemlich offensichtlich sein, je höher die Auflösung (Werte, auf die gerundet werden soll), desto geringer das Quantisierungsrauschen. Eine höhere Bittiefe sorgt für eine höhere Vollskalenauflösung. Eine höhere Auflösung reduziert das Quantisierungsrauschen, indem mehr Werte verfügbar sind, um den Wert des Signals bei einem Sample möglichst genau abzugleichen. Das Reduzieren des Quantisierungsrauschens senkt das Grundrauschen und erhöht das Signal-Rausch-Verhältnis (SNR).

Können Sie den Unterschied zwischen 16- und 24-Bit-Quantisierung hören? Ich wette alles, was Sie nicht können. Es ist für eine Gitarre, und Gitarren sind nicht für ihren Dynamikumfang bekannt. Eine professionelle Symphonie? Vielleicht, ohne Zittern. Das 16-Bit-Grundrauschen ist weit genug unten, dass es unwahrscheinlich ist, dass es erkennbar ist, aber der Unterschied wird messbar sein.

Zusammenfassend gilt meine Stimme für 48 kHz Abtastrate und 16 Bit Auflösung. Ich empfehle allen, die sich für dieses Thema interessieren, dringend, sich dieses Video anzusehen .

Das Video war unglaublich. Dies wird einige Fragen von mir aufwerfen.
+1 für den Unterschied zwischen messbar und wahrnehmbar - manchmal ist der Unterschied einfach zu gering, um gehört zu werden.
Unter idealen Bedingungen ist eine 16-Bit-Abtastung bei 44100 Hz ausreichend. Die Verwendung einer höheren Bittiefe und Abtastrate kann jedoch einige Aspekte des Systemdesigns vereinfachen. Um beispielsweise 96 dB SNR von einem 16-Bit-ADC zu erhalten, müsste die Eingangsverstärkung perfekt eingestellt sein. Wenn ein Gerät Eingaben von einer Vielzahl von Geräten akzeptieren muss, deren Spitzenpegel um den Faktor 100 variieren können, wäre ein 16-Bit-ADC mit fester Verstärkung nur für etwa 56 dB gut, wenn er mit einem Signal mit niedrigem Pegel verwendet wird. Im Gegensatz dazu wäre ein typischer 24-Bit-Audio-ADC in der Lage, über seinen gesamten Dynamikbereich ein konsistentes nützliches SNR zu verwalten.
@supercat Fairer Punkt, aber 96 dB SNR für eine Gitarreneffektbox sind ehrlich gesagt lächerlich.
@MattYoung: Es gibt zwei verschiedene Formen von SNR: das Verhältnis zwischen dem gleichzeitig gemessenen Signalpegel und dem Rauschpegel oder das Verhältnis zwischen dem maximalen Signalpegel und dem niedrigsten Rauschpegel, der auf einem Signal ungleich Null liegen kann . Für den ersten Takt würden einer Gitarre sogar 48dB genügen. Für die zweite ist jedoch viel mehr erforderlich. Bei einem Unterschied von mehr als 48 dB zwischen dem lautesten und dem leisesten Eingangspegel, den eine Box akzeptieren sollte, hätte ein 16-Bit-ADC nur 48 dB SNR im zweiten Takt, was nicht wirklich genug ist.
@MattYoung: Wenn man in Bezug auf die Abtastrate ein 12-kHz-Durchlassband wünscht, würde eine 48-kHz-Abtastung mit einem SNR von 48 dB einen 48-dB/Oktave-Filter erfordern. Die Verwendung von 96-kHz-Sampling würde einen 24-dB/Oktave-Filter erfordern, und die Verwendung von 192-kHz-Sampling würde nur einen 12-dB/Oktave-Filter erfordern. Darüber hinaus kann die Verwendung grober Interpolationsalgorithmen bei 192 kHz zu Ergebnissen führen, die mit der Verwendung besserer Filteralgorithmen bei 48 kHz vergleichbar sind, aber viel weniger Codierungsaufwand erfordern.

Zu beachten ist, dass die Leistung Ihres ADC und DAC stark von der unterstützenden Schaltung und dem PCB-Layout abhängt. Ich bin kein ADC-Experte, aber ich verstehe, dass 16-Bit aus elektrischer Sicht High-End und 24-Bit extrem ist. Wenn Sie eine 5-V-Referenz verwenden, beträgt 1 niederwertigstes Bit 76 uV bei einem 16-Bit-Wandler. Das ist ein Grundrauschen von -96 dB im besten Fall. Sind Sie zuversichtlich, dass Sie Lärm in diesem Ausmaß kontrollieren können? Denken Sie daran, dass auch Ihre Aufnahmeumgebung Rauschen erzeugt. Wenn Sie nicht in einem Aufnahmestudio sind und eine wirklich schöne Leiterplatte haben, glaube ich nicht, dass Ihnen ein 24-Bit-ADC helfen wird. Ich vermute auch, dass 96 kHz übertrieben sind und dass 48 kHz genauso gut funktionieren würden.

Nur zum Spaß können Sie mit dem 12-Bit-ADC auf dem STM32F4 experimentieren, um zu sehen, ob Sie einen Unterschied zu 16-Bit hören können.

Eine leicht zu übersehende Eigenart von Quantisierungssystemen wie ADCs besteht darin, dass ein ADC, der immer den Messwert zurückgibt, der dem Eingangswert am nächsten liegt, eine erhebliche Menge – bis zu ±½ LSB – an harmonischer Verzerrung hinzufügt, die viel unangenehmer sein kann, als es wäre ±½ LSB des Breitbandrauschens. Ein ADC, der ±½ LSB des Breitbandrauschens mit den richtigen Eigenschaften hinzufügt, könnte die harmonische Verzerrung eliminieren, aber wenn die Eigenschaften des Rauschens nicht ganz richtig wären, würde eine gewisse Verzerrung zurückbleiben. Während es nicht unmöglich ist, einen hochwertigen 16-Bit-ADC zu entwerfen, der eine sehr gut geformte ±½LSB-Rauschquelle hat, ist es oft viel einfacher, die Messungen einfach zu erweitern, um 24 Bit zu melden, wodurch das Quantisierungsrauschen (und die resultierende Harmonische) reduziert wird Verzerrung) um mindestens den Faktor 256.

Nehmen wir als Analogie an, man braucht ein Gerät, das eine Spannung mit einer Genauigkeit von 0,06 Volt anzeigt. Wäre es einfacher, ein solches Gerät mit einer Anzeige in Zehntel Volt oder in Hundertstel zu konstruieren? Wenn die Anzeige in Zehnteln erfolgt, muss das Gerät in der Lage sein, den Unterschied zwischen 1,139 und 1,161 Volt aufzulösen (ersterer muss als 1,1 und letzterer als 1,2 angegeben werden) – ein Unterschied von knapp über 0,02 Volt. Wenn die Anzeige in Hundertstel wäre, könnte sie einen Wert von 1,10 Volt für alles bis zu 1,159 Volt und einen Messwert von 1,11 Volt für alles bis zu 1,061 Volt melden, eine Streuung von etwa 0,1 Volt. Somit verringert das Bereitstellen signifikanterer Zahlen in der Auslesung tatsächlich die Genauigkeit der Schaltung, die notwendig ist, um eine gegebene Genauigkeit des Ergebnisses zu erreichen.

In Ihrem Fall würde ich zum Abtasten einer E-Gitarre mit einer maximalen Spitzenfrequenz von etwa 2,5 kHz und einer Abfallsteilheit von mindestens 12 dB / Oktave bei höheren Frequenzen dem allgemeinen Konsens von 48 kHz und 16-Bit-Auflösung zustimmen, obwohl Sie es bekommen in starke Modifikationen (z. B. mehrere Verzögerungsstreams), dann würden Ihnen 24 Bit besser dienen, wie @crgrace betonte.

Niemand hat bisher die Psychoakustik erwähnt, die eine wichtige Rolle bei der Wahrnehmung von digitalem Audio spielt, und da Ihre Frage war, ob Sie einen Unterschied hören können, denke ich, dass dies noch erklärt werden muss. Unsere Wahrnehmung von Klang wird mehr von Phaseninformationen als von Frequenz und Verzerrung dominiert. Du hast Delay und Chorus als deine nächsten Interessen nach Hüllkurvenmodulation erwähnt. Beide Effekte fügen der Originalquelle Phaseninformationen hinzu.

Wenn Sie jedoch entschieden haben, dass Sie den Umfang Ihres Projekts erweitern möchten, um Akustikgitarre oder Gesang einzubeziehen, wäre bei einer Abtastrate von 48 kHz und einer Tiefe von 16 Bit ein wahrnehmbarer Effekt zu verzeichnen. Zischlaute, der „s“-Laut in der Sprache, treten oft bei Gesang auf. Eine Akustikgitarre mit einem Piezo-Tonabnehmer hat auch eine Form von Zischen (wenn auch nicht von derselben Art), und es ist am besten, Signale über 3-5 kHz herauszufiltern, um dieses Problem zu vermeiden. Aber bei Vocals kann man nicht wirklich viel machen, außer einen De-Essing-Filter anzuwenden.

Zischen ist ein komplexer Klang, der ein Zusammenspiel von Phaseninformationen bei mäßig hohen Frequenzen aufweist. Der offensichtlichste Fall ist ein Sizzle-Becken. Mikrofon und nehmen Sie es mit verschiedenen Abtastraten auf und vergleichen Sie den aufgenommenen Ton mit dem Live-Ton. Je weiter Sie die Abtastrate verringern, desto mehr klingt das aufgenommene Signal wie hartes Rauschen, bis es unerträglich wird. Bei einer guten Aufnahme können Sie hören, wie sich die Nieten um das Becken bewegen. Dies ist einer der Gründe, warum manche Menschen analoge Aufnahmen gegenüber CDs bevorzugen.

Als Faustregel gilt, dass die Abtastrate das 10-fache der höchsten Signalfrequenz betragen muss, um Phasenverzerrungen zu minimieren. Eine E-Gitarre erzeugt wenige Obertöne höher als 5 kHz, daher funktioniert eine Abtastrate von 48 kHz recht gut. Wenn Sie Ihre Effekte jedoch allgemeiner verwenden möchten, z. B. Tonhöhenkorrektur oder Chorus für Gesang, würde ich zu höheren Abtastraten raten.

Die Bittiefe , worüber das OP spricht, hat nichts damit zu tun, einen bestimmten Frequenzbereich hören zu können. Mit anderen Worten, die Bittiefe repräsentiert die Auflösung der Schallintensität. Ich wette, wenn Sie qualitativ hochwertige Musik bekommen und sie über einen 16- und 24-Bit-Konverter produzieren, werden Sie den Unterschied deutlich hören! Das folgende Bild zeigt eine übertriebene Quantisierungs-„Treppe“ beim 16-Bit-Sampling:

Geben Sie hier die Bildbeschreibung ein

Jetzt ist die Abtastrate , die OP mit ADC verwechselt, anders. Ich denke, er meint 96 ks/s und 192 ks/s, was Oversampling bedeuten würde. Diese Zahlen stellen normalerweise die Vielfachen von 24 kHz dar - eine maximale Hörfrequenz mit etwas Reserve-Overhead (aufgrund nicht idealer Tiefpassfilter). 48-kHz-Sampling wäre also etwas über der Nyquist-Rate, 96 kHz bedeutet nur, dass es Stereo ist (zwei Kanäle), und 192 ist Quadro.

Daher müssen Sie jeden Kanal mit etwa 48 kHz abtasten, und wenn Sie einen 24-Bit-ADC-Sampler bekommen können - machen Sie es - die meisten kommerziellen Sound-Samples haben eine Tiefe von 24 Bit. Wenn Ihre Tonquelle (Quitar) jedoch laut genug ist, um die Auflösung zu beeinträchtigen, wird das Ausgeben von zusätzlichem Geld für den 24-Bit-Konverter Ihren Klang nicht verbessern.

Und wie @crgrace sagte, können Sie mit einer höheren Bittiefe den Informationsverlust während der digitalen Tonverarbeitung aufgrund von Abschneidefehlern verringern.

Die Bittiefe hat nichts mit "Schallintensität" zu tun, sondern mit Dynamikumfang und SNR.
@MattYoung Richtig, hast du es mit Lautstärke verwechselt? Ich meinte die Auflösung der Schallintensität, die im Wesentlichen SNR ist.
Ich bin mir nicht sicher, wie "Auflösung der Schallintensität" = SNR ist
@MattYoung Nun, weil eine Auflösung unter SNR nutzlos ist, da sie das Signal überwältigt. Und was soll dein Kommentar? Ich bin mir nicht sicher, was die Bittiefe mit dem Dynamikbereich zu tun hat?
Die MP3-Komprimierung ist keine einfache Verringerung der Bittiefe
Diese Bearbeitung macht diese Antwort einfach falsch. Bittiefe hat NICHTS mit Qualität zu tun. Eine Quantisierung mit 8 oder 24 Bit liefert genau das gleiche Signal. Der Unterschied besteht darin, dass die 24-Bit-Version ein viel niedrigeres Grundrauschen hat.
Das letzte Bild ist absurd ungenau.
Das letzte Bild sieht aus, als käme es aus dem Verkaufsblatt des "High Resolution Audio Player".
Aufgrund mehrerer Kommentare zu dem Teil des Bildes, der eine MP3-Wellenform darstellte, die sich nicht auf die Frage bezog (es war nur ein Teil des Bildes), habe ich diesen Teil abgeschnitten.