Typische Latenz vom Mikrofon bis zu den digitalisierten Samples auf einem PC

Ich möchte eine Echtzeit-Audioverarbeitung auf einem PC durchführen (es könnte Windows oder Linux sein). Dafür muss ich sehr schnell digitalisierte Audiodaten von einem Mikrofon bekommen. Ich frage mich, was der typische Latenzbereich ist, den ich erwarten sollte. Liegt es im Bereich von Mikrosekunden? Zwischen 1 bis 10 ms? Mehr als 10 ms? Wenn es mehr als ein paar ms sind, gibt es eine Möglichkeit, es auf 1 ms oder weniger zu reduzieren? Wenn dies auf einem PC nicht möglich ist, gibt es Audiokarten-Entwicklungskits mit DSP-Prozessor, die für die Echtzeit-Audioverarbeitung geeignet sind?

Als ich neulich Abend mit Gitarre und Bass herumgespielt habe, fand ich 5 ms Roundtrip-Latenz kaum akzeptabel. Ich könnte mit 10 ms Latenz nicht mein Bestes geben - tatsächlich würde ich einfach eine andere Lösung finden, wenn das die beste wäre, die ich bekommen könnte. Weniger als 5 ms Hin- und Rückweg wären wahrscheinlich für die meisten Musiker in Ordnung, ich wäre überrascht, wenn jemand weniger als 1 ms bemerkt (falls das erreichbar ist).

Antworten (2)

Es gibt viele Variablen, die sich auf die Gesamtlatenz auswirken, da es mehrere Latenzquellen gibt. Latenz entsteht durch den Analog-Digital-Wandlungsprozess und dann durch mehrere verschiedene Puffer, wie den Bus-Puffer (z. B. den USB-Puffer) und normalerweise mindestens zwei Software-Puffer (vom Treiber und der DAW). Wenn Plug-Ins Teil der Signalkette sind, wird es viel chaotischer, da einige Plug-Ins eine Latenz von 500 ms oder mehr einführen (das ist bei den meisten Plug-Ins selten, aber möglich oder sogar wahrscheinlich für Look-Ahead-Peak-Limiter oder Faltung Hall).

RME bewirbt zum Beispiel eine Latenz für seine BabyFace-Oberfläche von nur 14 Samples für OS X-Treiber. Bei einer Abtastrate von 96 kHz sind das weniger als 1 ms. Das ist nur ein Teil des Bildes. Auf meinem Computer betreibe ich den Puffer für Ableton Live mit 128 Samples, was bei 44,1 kHz einer Latenz von über 6 ms entspricht, und das in eine Richtung. Die gesamte Roundtrip-Latenz für meine aktuellen Einstellungen beträgt etwa 12 ms, was nicht schnell genug ist, um damit aufzunehmen.

In der Praxis habe ich immer Wert auf eine zuverlässige Aufzeichnung gelegt, d.h. ich möchte größere Buffer, da ein Buffer Underrun eine Lücke in der Aufzeichnung ist. Größere Puffer bedeuten mehr Latenz-Samples. Daher stelle ich sicher, dass ich immer überwachen kann, ohne mich auf Audio zu verlassen, das durch die DAW geroutet wird. Wenn ich in einem DAW-Kanal aufnehme, ist der Kanal aufnahmebereit, aber auch stummgeschaltet. Ich verwende dann entweder einen Mixer oder ein Interface-Low-Latency-Monitoring (ein in das Interface integriertes digitales Mischpult), um nahezu latenzfreies Audio der Performance mit den vorhandenen Backing-Tracks oder Click-Tracks zu kombinieren.

Wenn Sie eine digitale Audioverarbeitung mit extrem niedriger Latenz wünschen, besteht eine Option darin, dedizierte Verarbeitungsleistung zu erhalten. Es gibt jetzt viele Audio-Interfaces, die einige grundlegende Audioverarbeitung (Eq, EQ, Reverb) als Teil ihrer digitalen Monitormixer mit niedriger Latenz enthalten. Es gibt einige High-End-Produkte, die eine Schnittstelle mit einem dedizierten DSP kombinieren, der in Echtzeit oder zum Bearbeiten und Mischen verwendet werden kann, wie z. B. die UAD Apollo-Produkte.

Wie JCPedroza kommentierte, gibt es Tools, die eine Echtzeitverarbeitung mit nativer CPU-Leistung ermöglichen. Ich weiß nicht viel über diese zu diesem Zeitpunkt.

Mit einem preiswerten (160 USD) USB-Audiointerface, auf dem OS X auf einem MacBook Pro mit einem i5-Prozessor ausgeführt wird, kann ich die Roundtrip-Latenz ohne wirklich schlechte Artefakte nicht unter etwa 6 ms bringen. Ich vermute, eine bessere Schnittstelle würde mir bessere Ergebnisse liefern. Anscheinend haben die meisten Thunderbolt-Schnittstellen eine viel geringere Latenz als die USB-Schnittstellen.

Bearbeiten: Hier gibt es ein Latenzdiagramm für eine Marke schneller Thunderbolt-Schnittstellen .

Round Trip Latency* (ms) getestet bei 96 kHz auf OS 10.10 und Mac Pro

Puffergröße Pro Tools 11 Logic Pro X Cubase 7 Ableton Live 9 Reaper 4.7
32 nicht zutreffend 1,67 1,67 2,09 1,44
64 1,38 2,33 2,33 2,42 2,11
128 2,29 3,67 3,67 3,76 3,44

Daraus können wir mehrere Dinge ableiten:

  1. Sie können eine Latenz von weniger als 1 ms auf dem Weg vom Mikrofon zu den Samples erreichen, aber der Hin- und Rückweg dauert etwa doppelt so lange, und das wird mehr als 1 ms für alle außer den teuersten Schnittstellen sein.
  2. Die Software, die Sie verwenden, spielt eine Rolle (ich war überrascht, ProTools mit der niedrigsten Latenz zu sehen).
  3. Kleinere Puffergrößen sind entscheidend, um die niedrigste Latenz zu erzielen, können jedoch zu Problemen mit der Klangqualität führen, wenn der Computer zu schwach ist.
  4. Höhere Abtastraten (das 48-kHz-Abtastratendiagramm wird hier nicht zitiert, ist aber langsamer) sind ebenfalls entscheidend, um die niedrigste Latenz zu erzielen, üben aber wiederum Druck auf die Computerhardware aus.

TL;DR: Mit der richtigen (meist teuren) Schnittstelle, dem Computer und der Software ist das möglich.

Gute Antwort, aber vielleicht unterschätzen Sie Computer-CPUs für Echtzeit-Audio und Live-Einsatz. Es gibt unzählige Beispiele von Künstlern, die erfolgreich CPUs für die Audioverarbeitung bei Live-Auftritten integriert haben. Ein berühmtes Beispiel ist Nine Inch Nails mit Mainstage, das alles "von Gesangseffekten bis hin zu Gitarren-Patches" ausführt. Überprüfen Sie youtube.com/watch?v=4kU0skUZTIw
@JCPedroza Wenn Apple mir etwas verkaufen wollte, ist es eine gute Möglichkeit, NIN Survivalism im Video aufführen zu lassen. Außerdem habe ich heute gerade mit einem Bassisten gearbeitet und wir haben darüber gesprochen, ein komplettes Keyboard-Rig aus einem Laptop zu machen und dachten, wir könnten es nicht tun, aber jetzt sieht es so aus, als ob wir es könnten. Vielen Dank!

Ich verwende Linux seit vielen Jahren für Echtzeitmusik und hatte noch nie einen Fall, in dem die End-to-End-Latenz mehr als ein paar Millisekunden betrug. Schauen Sie sich kxstudio an. Ich kann nicht mit Windows oder Mac sprechen, da ich keine Erfahrung damit hatte, diese für Musik zu verwenden.

Ich habe nicht die Wiederholungen, um das zu kommentieren, aber seien Sie natürlich vorsichtig, wenn Sie einen Laptop mit auf die Bühne nehmen, insbesondere mit einem USB-Audio-Interface. Aber das ist ein anderes Thema.

Wenn Sie Linux verwenden, sollte Ihr Jack-Gui Ihrer Meinung nach Ihre Latenz anzeigen. Aber ich bin mir fast sicher, dass es keine Latenz in Ihrer Audiokarte oder Ihren Modulen gibt. Der Goldstandard, wenn Sie alles in die Audiokette aufnehmen möchten, besteht darin, Ihren Audioausgang mit Ihrem Audioeingang zu verkabeln und beide auf separaten Spuren aufzunehmen. Dann bringen Sie sie in Kühnheit oder ähnlichem zur Sprache und messen Sie.
Oh und um ein paar Millisekunden, das war im Allgemeinen. Wenn das Booten dieser Anwendung gewidmet ist und Sie nur diese dedizierte Echtzeitanwendung ausführen, sollten Sie heutzutage unter 1 ms kommen, es sei denn, Ihre Verarbeitung ist ein echtes Schwein. Auch hier wäre die Einschränkung, wenn Sie USB-Audio verwenden, aber trotzdem frage ich mich bei USB3, ob das immer noch ein Problem ist. Darf ich fragen warum du das fragst?
Um die Latenz zu messen, verbinden Sie den Audioausgang mit dem Audioeingang und nehmen beide auf separaten Spuren auf. Dann messen Sie in Kühnheit oder was auch immer den Unterschied.