Fukada Tree
Der Fukada Tree ist ein Decca Tree-Array, jedoch mit fünf Nierenmikrofonen und zwei zusätzlichen Kugelmikrofonen als Ausleger, die zwischen die Front- und Rear-Kanäle gemischt werden. Dieses Setup wurde 1997 von Akira Fukada entworfen.
Die Wahl von Nierenmikrofonen verbessert die Signaltrennung während die rückwärts gerichteten hinteren Nieren das Übersprechen von direktem Frontschall zu den hinteren Lautsprechern minimieren.
Kugelmikrofone werden in Decca Tree-Konfiguration aufgrund ihrer natürlichen Klangfarbe und ihres vollen Frequenzspektrums für Musikaufnahmen bevorzugt. Die beiden Kugel-Ausleger dienen dieser sehr wichtigen Komponente im Fukada Tree-Array.
Seit der ersten Ankündigung der Fukada Tree-Anordnung hat Akira Fukada eine Reihe von Positionierungsänderungen entwickelt, um die Front-Lokalisierung zu verbessern. Seine Auswahl an Mikrofonen bleibt jedoch unverändert und er verwendet weiterhin DPA-Mikrofone aufgrund ihrer Transparenz.
Hamasaki Quadrat
Das Hamasaki Quadrat besteht aus vier bi-direktionalen Mikrofonen, die in einem Quadrat angeordnet sind.
Das Hamasaki Quadrat wurde für die Erfassung des Ambient-Sounds / des diffusen Teils einer Surround-Sound-Aufnahme konzipiert. Es handelt sich um ein Quadrat aus vier Mikrofonen mit Achtercharakteristik, die im Abstand von 1,8 – 2 m (5.9 – 6.6 ft) zueinander aufgebaut sind und deren Signale im entsprechenden Mischungsverhältnis zum Front-Array auf die Kanäle Links, Rechts, Links Surround und Rechts Surround geroutet werden. Die Achter-Kapseln weisen mit ihrer In-Phase-Ausrichtung zu den Seiten und mit ihren Nullen zum Direktschall.
Verglichen mit anderen Systemen für Ambient Recording ist dieses System in Bezug auf Abstand zwischen dem Hauptarray und dem Ambient-Array am unempfindlichsten.
Der Aufbau wurde vom japanischen Toningenieur Kimio Kamasaki entwickelt.
Immersives Audio mit vertikaler Abbildung
Setups, die für herkömmliche Surround-Aufnahmen (wie 5.1) entwickelt wurden, haben sich als sehr gut erwiesen. Das Hinzufügen von Vertikalinformationen in diese Aufnahmen ist interessant, da es dem wahrgenommenen Erlebnis auch neue Dimensionen hinzufügen kann.
Die Herausforderung besteht darin, nach oben ausgerichtete Klangkulissen hinzuzufügen, ohne die wahrgenommene Lokalisierung von horizontal positionierten Schallquellen zu verändern, also das vertikale Kanalübersprechen zu minimieren. Dies führt zu Überlegungen hinsichtlich vertikaler Zeit- und Pegeldifferenzen. Der für die Dekorrelation erforderliche Abstand vertikaler Mikrofone muss ebenfalls berücksichtigt werden. Wie kann schließlich eine Kammfilterung im unvermeidlichen Downmix vermieden werden?
Wenn Vertikalinformationen auf die richtige Weise hinzugefügt werden, wird die empfundene Einhüllung des Sounds gesteigert. Darüber hinaus belegt die Praxis, dass die wahrgenommene Präzision bei der Lokalisierung von Schallquellen auch in der horizontalen Ebene verbessert wird.
Beispiele: Ein Standard-Wiedergabe-System für Immersives Audio mit Vertikalinformationen ist 9.1. Hierbei handelt es sich um ein 5.1 Standard-Layout nach ITU 775 mit zusätzlichen Lautsprechern in der Ebene über den Lautsprechern für Links, Rechts, Links Surround und Rechts Surround. Die Höhe der vier zusätzlichen Lautsprecher sollte einen vertikalen Abhörwinkel von etwa 30° ermöglichen.
Dr. Hyunkook Lee von der Huddersfield University (UK) und seine Forschungsgruppe haben viele theoretische und praktische Informationen zur wahrgenommenen Schallabbildung geliefert.
Ein wichtiger Faktor, den er fand, ist, dass der Präzedenz-Effekt (der Effekt, dass der erste ankommende Schall die Richtung bestimmt) in der vertikalen Ebene nicht funktioniert. Daher lohnt es sich, sich mit Pegeldifferenzen zu beschäftigen. Bei der Wiedergabe desselben Signals über die unteren und die oberen Lautsprecher wurde festgestellt, dass die Präsenz von Hochtonanteilen und Transienten im Signal die Lokalisierung zum oberen Lautsprecher hin verschiebt [2,3].
Beispiel: Um die Lokalisierung in der hoizontalen Ebene zu halten, wurde ermittelt, dass das obere Signal um mindestens 7 dB gedämpft werden muss.
Diese Erkenntnisse haben zu dem unten gezeigten Mikrofon-Setup geführt. Es besteht aus acht Nierenmikrofonen und zwei Supernierenmikrofonen.
Die Mikrofone sind so ausgerichtet, dass möglichst wenig Frontschall von den oberen Mikrofonen erfasst wird. Im Allgemeinen sollten die oberen Mikrofone so wenig Schall wie möglich empfangen, der von den primären horizontalen Quellen abgegeben wird oder von Quellen unterhalb der horizontalen Ebene.
Literatur:
[1] Wallis, Rory, and Lee, Hyunkook: The Effect of Inter-channel Time Difference on Localization in Vertical Stereophony. Journal of the Audio Engineering Society, Vol. 63, No. 10, October 2015.
[2] Lee, Hyunkook, and Gribben, Christopher: Effect of Vertical Microphone Layer Spacing for a 3D Microphone Array. Journal of the Audio Engineering Society, Vol. 62, No. 12, December 2014.
[3] Lee, Hyunkook: Perceptual Band Allocation (PBA) for the Rendering of Vertical Image Spread with a Vertical 2D Loudspeaker Array. AES Convention 138, Warzawa 2015.
[4] Lee, Hyunkook: The Relationship between Interchannel Time and Level Differences in Vertical Sound Localisation and Masking. AES Convention 131, New York 2011.
IRT Kreuz
Das IRT-Kreuz ist für die Erfassung von Ambient-Sound ausgelegt. Das Setup besteht aus vier Nierenmikrofonen.
Das IRT Kreuz dient zum Erfassen des Ambient-Sounds / Diffusschalls einer Surround-Sound-Aufnahme. Es ist ein Quadrat aus vier Nierenmikrofonen mit einem Abstand von 20 – 25 cm (7.9 – 9.8 in) zueinander, die auf Link, Rechts, Links Surround und Rechts Surround geroutet und in einem angemessenen Abstand verglichen mit dem Front-Array platziert werden.
Das IRT Kreuz wird normalerweise einige Meter hinter das Haupt-Array gesetzt. Es sollte jedoch nicht zu weit entfernt sein, da im reproduzierten Signal ansonsten Laufzeitprobleme (wie ein Echo) auftreten können. Die optimale Platzierung eines IRT Kreuzes zeigt sich in der Balance zwischen ausreichender Atmosphäre und gleichzeitiger Vermeidung von Echo.
Objekt-basiertes Audio
Seit Jahren ist der am meisten umhüllende Klang von Lautsprechern kanalbasiert. Ein Kanal ist für Mono, zwei Kanäle sind für Stereo und sechs Kanäle sind für 5.1 Surround-Sound (oder 22 Kanäle für NHK 22.2).
Konventionen bezüglich der Platzierung der Lautsprecher für jedes Format waren das Rückgrat des Sounddesigns. Inter-Channel-Panning mit Hilfe von Delay- und Pegel-Anpassungen waren das Werkzeug für die Platzierung von Quellen im Klangbild. Das fertige Produkt würde für eine bestimmte Zahl an Kanälen ausgelegt sein. Auch wenn das ursprünglich aufgenommene Programmmaterial eine Vielzahl von Audiokanälen umfasste, würde das fertige Produkt eine feste Zahl an Kanälen umfassen – einen für Mono, zwei für Stereo usw.
Objektbasierte Audio (OBA) ist etwas anders. Ein "Klangobjekt" kann auf einer oder mehreren Spuren aufgezeichnet werden. Zusammen mit dem Ton werden Metadaten geliefert, aus denen hervorgeht, wo der Sound auf der Klangbühne positioniert werden soll.
Ein Objekt kann eine Stimme sein, die in Mono aufgezeichnet wurde. Wenn die Produzenten beabsichtigen, die Stimme von der rechten Seite der Klangbühne kommen zu lassen, enthalten die Metadaten dieser aufgenommenen Stimme die Koordinaten für diesen Sound. Die Stimme wird aus diesem Grund als Stereospur aufgezeichnet. Die Metadaten dieser Stereospur liefern dann die Daten für die Positionierung.
Prinzipiell kann ein Objekt auch aus einer Ambisonic-Aufnahme oder einem anderen Format stammen. Deshalb wird ein AV-Programm mit OBA aus einer Reihe von Objekten wie Sprachaufnahmen, Musik, Umgebungsgeräuschen, speziellen Soundeffekten usw. erstellt. Jedes Objekt enthält Metadaten darüber, wann und wo es wiedergegeben werden soll.
OBA hat bereits den Weg ins Kino gefunden (Dolby Atmos und dergleichen). Es ist aber geplant, es auch in den Rundfunk zu bringen und es wurden viele Experimente durchgeführt. Darüber hinaus ist Virtual Reality (VR) ein naheliegendes Ziel für OBA.
Warum?
Die generelle Idee liegt darin, dem Hörer einen höheren Freiheitsgrad zuzugestehen, insbesondere im Rundfunk. Mit OBA ist es möglich, ein einzelnes Objekt zu betonen. Wenn ein hörgeschädigter Zuhörer den Dialog verstärken möchte, ist dies eine Möglichkeit, wenn der Dialog als Objekt aufgezeichnet wird. Man kann auch die Sprache des Kommentars ändern, wenn jede Sprache einem separaten Objekt zugeordnet wird.
Aus Fernsehproduktionen wie Formel-1-Rennen wissen wir, dass spezielle Bordkameras ausgewählt werden können, wenn der Zuschauer einem bestimmten Auto folgen möchte. Der Ton dieses spezifischen Autos ist ein Objekt in Verbindung mit dem Bild. Bestimmte Musikinstrumente in einem Orchester können als Objekte betrachtet werden. Alternativ kann der an verschiedenen Hörpositionen aufgenommene Klang eines Konzerts ein Objekt sein.
Ein weiteres Argument für OBA ist, dass fast jedes Reproduktionsformat gültig ist. Der Downmix wird in Abhängigkeit von der Kanalzahl und deren für die Wiedergabe verfügbaren Positionen optimiert (solange die Anzahl der Kanäle mindestens zwei beträgt). Binaurale Reproduktion ist hierfür ebenfalls zulässig.
Mikrofone?
Die grundlegende Idee ist, dass der Tontechniker die von ihm bevorzugten Mikrofone verwenden kann. Es gibt nicht zwingend eine Notwendigkeit für bestimmte Mikrofone, Mikrofonkonfigurationen oder Mikrofonmarken. Die besonderen Anforderungen betreffen die Produktionsausstattung, mit der die Metadaten erzeugt werden können und natürlich die Formate, die die vollständigen Informationen enthalten.
Empfohlene Mikrofone & Zubehör
Kugelkapsel-basiertes Surround-Array
• 4006A Kugelmikrofon
• 4006C Kugelmikrofone, Kompakt
• 5006A Surround-Kit aus fünf gematchten 4006A, Clips und Windschutz im Peli™-Case
• S5 Surround/Decca Tree Mount
Nierenkapsel-basiertes Surround-Array
• 4011A Nierenmikrofon
• 4011C Nierenmikrofon, Kompakt
• S5 Surround/Decca Tree Mount
Breite-Nierenkapsel-basiertes Surround-Array (WCSA)
• 4015A Mikrofon mit breiter Nierencharakteristik
• 4015C Mikrofon mit breiter Nierencharakteristik, Kompakt
• 5015A Surround-Kit aus fünf gematchten 4015A, Clips und Windschutz im Peli™-Case
• 4006A Kugelmikrofon
• 4006C Kugelmikrofone, Kompakt
• 3506A Surround-Kit aus zwei gematchten 4006A, Clips und Windschutz im Peli™-Case
• S5 Surround/Decca Tree Mount
Optimiertes Nieren-Dreieck (OCT)
• 4011A Nierenmikrofon
• 4011C Nierenmikrofon, Kompakt
• 4018A Supernieren-Mikrofon
• S5 Surround/Decca Tree Mount
Doppel-MS
DPA bietet keine Mikrofone mit Achtercharakteristik. Wenn dieses Setup mit DPA-Mikrofonen aufgebaut werden soll, empfehlen wir, die Mikrofone mit Achtercharakteristik durch jeweils zwei Nierenmikrofone zu ersetzen:
• ST4011A Stereopaar mit 4011A Nierenmikrofonen
• SB0400 Modularer Stereo-Boom
• UA0836 Stereo-Boom
• DUA0019 Abstandshalter für Stereo-Boom, 19 mm (0.75 in)
Fukada Tree
• 4011A Nierenmikrofon
• 4011C Nierenmikrofon, Kompakt
• 4006A Kugelmikrofon
• 3506A Surround-Kit aus zwei gematchten 4006A, Clips und Windschutz im Peli™-Case
• S5 Surround/Decca Tree Mount
• ST4011A Stereopaar mit 4011A Nierenmikrofonen
• SB0400 Modularer Stereo-Boom
Hamasaki Quadrat
DPA bietet keine Mikrofone mit Achtercharakteristik. Wenn dieses Setup mit DPA-Mikrofonen aufgebaut werden soll, empfehlen wir, die Mikrofone mit Achtercharakteristik durch jeweils zwei Nierenmikrofone zu ersetzen:
• ST4011A Stereopaar mit 4011A Nierenmikrofonen
• S5 Surround/Decca Tree Mount
Immersives Audio mit Vertikaler Abbildung
• 8 x 4011A Nierenmikrofon
• 2 x 4018 Supernierenmikrofon
IRT Kreuz
• 4011A Nierenmikrofon
• 4011C Nierenmikrofon, Kompakt
• ST4011A Stereopaar mit 4011A Nierenmikrofon
• MMC4011 Nierenmikrofonkapsel
• MMP ER/ES Modulares Aktivkabel
• SB0400 Modularer Stereo-Boom
• UA0837 Stereo-Boom
DPA 5100 Surround-Mikrofon
Das 5100 Surround-Mikrofon ist eine Plug-and-Play-Lösung.
Ein System besteht aus drei direktionalen (DIP-MIC, direktionaler Druckempfänger), koinzident angeordneten Frontmikrofonen. Die hinteren Kanäle werden über ein auf Abstand platziertes Kugelmikrofonpärchen aufgezeichnet. Das System verfügt außerdem über einen LFE-Ausgang. Alle Kanäle sind auf Unity Gain kalibriert. Der LFE ist standardmäßig um 10 dB reduziert.
Das 5100 ist ein hochgeschätztes System in der Filmproduktion.
Referenzen
[1] Gasull Ruiz, Allejandro: A Description of an Object-Based Audio Workflow for Media Productions. Convention Paper 9570, AES 140th Convention, Paris 2016.
[2] Steven A.: Object-based audio for television production. IBC 2015.
[3] Messonnier, Jean-Christophe et al.: Object-based audio recording methods. Conference proceedings, AES 57th International Conference, USA, 2015.
[4] Shirley, Ben et al.: Personalized Object-Based Audio for Hearing Impaired TV Viewers. Journal of the Audio Engineering Society, Vol. 65, No. 4, April 2017.