Mehrkanal-Musikformat MP3 Surround: eine Schweizer Erfindung (ETH) Rundum-Raumklang für den Heimgebrauch und fürs Internet
Herbert Bruderer
Artikel erschienen in Swiss IT Magazine 2007/08
Um Speicherplatz zu sparen, werden umfangreiche Dateien oft gepackt (komprimiert). Das beschleunigt den Datenaustausch über Netzwerke wie das Internet. Texte, Rechentabellen, Datenbanken und (grundsätzlich auch) Bilder lassen sich verlustfrei (ohne Qualitätseinbusse) komprimieren. Für Filme und Musik gilt das nur beschränkt: Man unterscheidet zwischen der verlustlosen und der verlustbehafteten Video- bzw. Audiokompression.
Für die Herstellung (Verschlüsselung, Kodierung, Packen) und die Aufbereitung (Entschlüsselung, Dekodierung, Entpacken) von Tondateien sind sehr anspruchsvolle Programme erforderlich, sie heissen Codec (compressor/decompressor oder coder/decoder). Es gibt zahlreiche (verlustbehaftete) Tonformate, jedoch nur wenige haben sich durchgesetzt. Das mit Abstand erfolgreichste ist MP3. MP3 steht für die ISO-Norm MPEG 1 Audio Layer 3 (MPEG: Moving Picture Expert Group, Layer = Schicht). Im Unterschied zu den herstellerabhängigen Formaten WMA (Windows Media Audio) von Microsoft und Real Audio von Real Networks ist dieser Standard offen. Als hauptsächlicher Erfinder von MP3 gilt Karlheinz Brandenberg (Fraunhofer-Gesellschaft).
MP3 wurde 1992 eingeführt. Das qualitativ hochwertige Zweikanal-Stereotonformat ist u. a. dank der tragbaren MP3-Abspielgeräte weltweit verbreitet. So ist etwa Apples iPod ein Verkaufsschlager. MP3 wird zudem von allen DVD-Spielern unterstützt und ist unter den gängigen Betriebssystemen wie Windows, Mac-OS und Linux verfügbar. Die hohe Qualität und der vergleichsweise geringe Speicherbedarf haben den Austausch von MP3-Musikdateien übers Internet sprunghaft ansteigen lassen, was zu urheberrechtlichen Auseinandersetzungen geführt hat. MP3 wird auch für das Abspielen von Musikdateien aus dem Internet (mit Anhören während des Herunterladens) verwendet (Streaming). Die meisten MP3-Wiedergabegeräte verstehen auch das Format WMA. Manche unterstützen z. T. auch andere Formate, z. B. AAC (advanced audio coding) von Apple, Atrac von Sony, Apple Lossless oder (selten) das freie Ogg Vorbis.
Die Aufzeichnungsrate kann fest vorgegeben werden (CBR, constant bit rate) oder veränderlich bleiben (VBR, variable bit rate). Für die Wiedergabe von MP3-Dateien braucht man Programme wie Winamp, Macamp, Windows Media Player oder iTunes (Apple). Die Verbreitung der verlustfreien Audiokompression ist gering, weil die Datenreduktion dürftig ist. Die einwandfreie Qualität hat einen sehr hohen Speicherplatzbedarf zur Folge.
Für die Datenreduktion wird u. a. der Umstand ausgenutzt, dass das menschliche Ohr nur bestimmte Frequenzen wahrnehmen kann. Nicht hörbare und leisere Töne werden herausgefiltert, Überlagerungen von Tönen entfernt. Der Hörbereich (Klangspektrum) reicht etwa von 20 Hz bis 20 KHz. Mit MP3 wird die Datenmenge auf ein Zehntel bis ein Zwölftel der Ausgangsdatei geschrumpft. Trotz dieser so genannten psychoakustischen Kompression ergibt sich eine Audio-CD-ähnliche Tonqualität.
Eine Minute Musik in Stereo-CD-Qualität benötigt in nicht komprimierter Form rund 10,6 Megabyte. Auf einer CD (650 MB) lassen sich also etwa 61 Minuten Musik ablegen. Nach der Datenreduktion beansprucht eine Minute Musik noch ungefähr 1 MB. Auf einer CD haben also rund 10 Stunden (komprimierte) Musik Platz. MP3 eignet sich für das Packen von Mono- und Stereo-Audio bei üblichen Abtastraten (16 bis 48 kHz) und bei Datenraten bis zu 320 kbit/s.
Einen Rundum-Raumklangeindruck vermittelt erst die Mehrkanalkodierung. Neben den beiden Stereolautsprechern werden für das Abspielen ein zentraler Lautsprecher und zwei hintere seitliche Lautsprecher benutzt. Der zentrale Lautsprecher erhöht die Stabilität des Stereobildes vorn. Die Lautsprecher hinten bilden die wichtigen seitlichen Raumreflexionen von Konzertsälen nach. Bei der Aufnahme von Mehrkanal-Audiosignalen wird in der Regel pro Kanal ein Mikrofon verwendet. Dieses nimmt den Klang in Richtung des Lautsprechers auf. Mehrkanal-Tonsignale können aber auch gemischt werden.
Am bekanntesten ist das Musikformat Dolby Digital (AC-3, Audio Code Nr. 3) der Dolby Laboratories, San Francisco, Ca. Dieses Musikformat wird für Video-DVDs und in Kinos eingesetzt. Ein weiteres (selteneres) Format ist DTS (Digital Theatre Systems). Für den Heimgebrauch sind entsprechende Audiocodes jedoch unerschwinglich. Die Internationale Fernmeldeunion (ITU) hat den 5.1 Standard festgelegt: 5 Hauptlautsprecher, 1 Zusatzlautsprecher. Nicht ITU-genormt sind hingegen 7.1 sowie 10.2.
Seit kurzem gibt es ein neues Mehrkanal-Audioformat, MP3 Surround. Die dabei benutzte Mehrkanalerweiterung wurde im Wesentlichen von Christof Faller entwickelt. Christof Faller, 1974, Elektroingenieur (ETH Zürich) und Dr. ès sciences (ETH Lausanne), hat die neue, wegweisende Kodiertechnik ab 1999 im Auftrag der weltberühmten Bell-Labors, Murray Hill, N. J., und von Agere Systems, Allentown, PA, entwickelt. Er ist Erfinder der grundlegenden Patente, z. T. gemeinsam mit Dr. Frank Baumgarte (damals bei Agere, heute bei Apple).
Was war der Anlass zu dieser Forschungsarbeit? Christof Faller: „Ich arbeitete bei den Bell-Labors an der Entwicklung von Audiokodierungsverfahren für das digitale Satellitenradio. Um die Anzahl der Radiokanäle von 50 auf 100 zu erhöhen, versuchten wir, Stereo- und Mehrkanal-Signale in Form von (weniger speicherhungrigen) Monosignalen zu übermitteln.“ Der entscheidende Durchbruch besteht darin, dass es Faller erstmals gelang, ein Mehrkanal-Audiosignal in ein einziges Monosignal zu packen. Dabei werden zusätzlich die Signaleigenschaften zwischen den Audiokanälen untersucht, die bei den Zuhörerinnen und Zuhörern den räumlichen Eindruck erzeugen. Mithilfe dieser Signaleigenschaften, für deren Darstellung nur wenig Speicherplatz/Sekunde nötig ist, wird das Monosignal wieder in ein Mehrkanalsignal umgewandelt. Was haben die Nachforschungen gebracht? „Wir haben neue Erkenntnisse über das räumliche Hören gewonnen. Um Klangquellen räumlich getrennt wahrzunehmen, braucht das Gehirn die Quellsignale nicht wirklich zu trennen.“
Das 1985 gegründete Fraunhofer-Institut für integrierte Schaltungen in Erlangen hat die von Faller und Baumgarte entwickelte Technik angepasst und erfolgreich mit MP3 kombiniert. Es versucht nun, MP3 Surround mithilfe von Agere Systems und dem französischen Lizenznehmer Thomson zu vermarkten. Die Fraunhofer-Gesellschaft ist mit über 50 Forschungseinrichtungen die grösste Organisation für angewandte Forschung in Europa.
MP3 Surround ergänzt das beliebte Zweikanalformat MP3 mit räumlichen Zusatzinformationen. Dieses Verfahren hat den grossen Vorteil, dass MP3 Surround abwärtsverträglich ist. Im Unterschied zu anderen Mehrkanal-Klangformaten läuft MP3 Surround daher auch auf herkömmlichen MP3-Abspielgeräten und Abspielprogrammen (in Stereoqualität). Dabei stehen allerdings nur zwei Audiokanäle zur Verfügung, der Mehrkanal-Raumklang entfällt. Die Menge der (zusätzlichen) Mehrkanalinformationen ist gering, sie beträgt bloss etwa 10 %. MP3 Surround unterstützt den 5.1-Kanal-Raumklang, die Anzahl der Kanäle ist nicht begrenzt. Dieses Tonformat eignet sich u. a. für DVD-Abspielgeräte, für mehrkanalfähige Hörfunksendungen übers Internet oder für Musikdienste, die ihre Werke über das World Wide Web verteilen.
Mit MP3 Surround hat man laut Faller bei klassischer Musik den Eindruck, rundum in die Musik eingetaucht zu sein. Es wird ein Eindruck wie in einem Konzertsaal erzeugt. Im Kino oder bei moderner Musik werden meist Quellen aus verschiedenen Richtungen nachgebildet.
MP3 Surround läuft auf handelsüblichen PCs und Macs, die mit einer Multikanal-Audiokarte (mindestens 6 Kanäle) und einem entsprechenden Lautsprechersystem ausgestattet sind.
Die Fraunhofer-Gesellschaft hat 2004 auf der Cebit in Hannover (weltgrösste Informatikmesse) erstmals eine Vorabversion von MP3 Surround vorgestellt. Eine Demodatei (Pack-, Entpack- und Wiedergabeprogramm) für Windows, Mac-OS und Linux kann unter der Webadresse www.mp3surround-format.de bezogen werden. Angaben zur Lizenzierung sind unter www.mp3licensing.com zu finden.
Digitale Mehrkanal-Audio(kompressions)formate
• Bruderer, Herbert: Raumklang für den Cyberspace. Mit MP3 Surround in die Musik eintauchen, in: Neue Zürcher Zeitung, Nr. 75, 1. April 2005, Seite 63 (Medien und Informatik),
• Bruderer, Herbert: Wer hat’s erfunden? MP3 Surround, in: Audiovision, 2005, Heft 11, Seite 98,
• Faller, Christof: Parametric Coding of Spatial Audio, ETH Lausanne, 2004, 183 Seiten (Dissertation): http://library.epfl.ch/theses, Name: Faller, PDF-Format,
• Faller, Christof: Rundumkopierer. Wie Spatial Audio Coding funktioniert, in: c’t Magazin für Computertechnik, 2005, Heft 22, Seiten 232–234,
• Webseiten: www.mp3surround-format.de (Demodatei), www.mp3licensing.com (Lizenzvergabe).
www.illusonic.com; info@illusonic.com.
Christof Faller erhielt für seine Arbeiten im Bereich der digitalen Tonbearbeitung, insbesondere für MP3 Surround, am 31. August 2006 an der ETH Lausanne den mit
50 000 Fr. ausgestatteten ersten
Innovationspreis der KPMG.
Nähere Angaben sind unter
www.kpmg.ch zu finden.
Die nach dem Erfinder des Telefons benannten weltberühmten Bell Labs, Murray Hill, N.J., wurden 1925 gegründet. Sie gehören zum mächtigen Fernmeldekonzern Lucent Technologies. Meilensteine in der Forschung der Bell Labs sind u. a. folgende Erfindungen: Fax, Transistor, Laser, Glasfaser, Solarzelle, Modem, Mobilfunk, Fernmeldesatellit, Programmiersprachen C und C++, Betriebssystem Unix. 6 Physiknobelpreise wurden an 11 Bell-Wissenschaftler verliehen. Hinzu kommen 3 Nobelpreise für Physik und 1 Nobelpreis für Chemie für ehemalige Mitarbeiter der Bell Labs. Agere Systems, Allentown, PA, ist ein aus Lucent Technologies ausgegliedertes führendes Unternehmen für Mikroelektronik.