Sztuczne zakończenie Dziesiątej Symfonii Beethovena

„Uwaga, dziś wieczorem usłyszycie przyszłość – ryzyko i skutki uboczne są niepewne”. Ten znak ostrzegawczy byłby odpowiedni w ten październikowy wieczór 2024 roku w siedzibie Brainlab w Monachium-Riem. Początkowo wszystko wskazywało na normalny koncert: pełna oczekiwań publiczność w zaciemnionej sali, oświetlona scena. Ale potem wydarzyło się coś niezwykłego. Oprócz wykonawców i kompozytorów, na podium pojawiła się również sztuczna inteligencja (AI), niewidzialna, a jednak nie do pomylenia.

NZZ.ch wymaga JavaScript do obsługi ważnych funkcji. Twoja przeglądarka lub blokada reklam obecnie to uniemożliwia.

Proszę zmienić ustawienia.

Na przykład, wykonano utwór Franza Schuberta, który w różnych wariantach był kontynuowany z pomocą sztucznej inteligencji. W kolejnym koncercie fortepianowym partia solowa została w całości skomponowana przez sztuczną inteligencję i zagrana na samogrającym fortepianie; jedynie partia orkiestrowa wymagała udziału człowieka. Tytuł trzeciego utworu trafnie zatytułowano „Negocjacje”: człowiek i maszyna w dialogu, kłócą się i walczą o kreatywność i dźwięk.

Czy to wszystko był tylko szalony eksperyment? A może to, co zainspirowało lub zirytowało publiczność podczas tej współpracy Uniwersytetu Muzycznego w Monachium z Filharmonią Monachijską, to tak naprawdę muzyka przyszłości?

Trochę kina mentalnego

Badając znaczenie cyfryzacji i sztucznej inteligencji dla muzyki, pojawiają się pytania o wymiarze egzystencjalnym. Jak będzie brzmieć muzyka nadchodzących dekad i stuleci? Jak sztuczna inteligencja zmieni silnie tradycyjny świat, w szczególności muzykę klasyczną? Czy istnieje coś takiego jak kreatywność techniczna? I czy ludzie w końcu staną się zdolni do zastąpienia ich jako twórców artystycznych?

To nie ulega wątpliwości od dawna: sztuczna inteligencja rośnie w siłę i nie zatrzymuje się na świecie harmonii, rytmów i melodii. Wręcz przeciwnie: istnieją powody, by sądzić, że rewolucja dokonuje się obecnie na scenie i za kulisami, w biurach programistów, wydawców muzyki cyfrowej i w studiach wielu kompozytorów.

Groza i fascynacja są tu ściśle ze sobą powiązane. Wypróbuj na przykład nowo wydaną aplikację Cantai. Utwory chóralne i wokalne śpiewane są pozornie realistycznymi głosami; uderzająco „ludzki” dźwięk to jednak czysta sztuczna inteligencja. Możesz też spróbować samemu, korzystając z programów do kompozycji, takich jak Udio czy Suno: wystarczy kilka słów kluczowych, aby stworzyć utwór muzyczny generowany przez sztuczną inteligencję.

Na pierwszy rzut oka to gigantyczna prowokacja. Czyż to nie właśnie ta indywidualna kreatywność, ta pomysłowość definiuje człowieczeństwo? A co, jeśli nie? Co, jeśli w przyszłości kompozytorzy stracą pracę, instrumentaliści zostaną zastąpieni przez perfekcyjnie grające komputery, a maszyna przeobrazi się w nowego Mozarta?

Tutaj zatrzymamy się przed wizualizacją, zanim tętno zacznie przyspieszać, i przyjrzymy się temu bliżej. Digitalizacja w świecie muzyki wcale nie jest nowym zjawiskiem; rozpoczęła się w latach 70. XX wieku, kiedy opracowano pierwsze technologie nagrywania cyfrowego. Pierwszym kamieniem milowym był format MP3, który później ułatwił przesyłanie muzyki przez internet. W 1981 roku, zawsze techniczny dyrygent Herbert von Karajan zaprezentował płytę kompaktową jako globalną sensację w Salzburgu. W rezultacie analogowe nośniki danych, takie jak kasety i stare dobre płyty, były coraz bardziej marginalizowane; mimo to rynek muzyczny ogromnie się rozwinął.

To również już historia. Serwisy streamingowe są dziś najważniejszymi platformami dystrybucji muzyki, a kiedy firma Open AI zaprezentowała pierwsze modele wielojęzykowe, nawet muzycy, którzy wcześniej pracowali wyłącznie analogowo, mogli wyczuć, że w przyszłości, obok kompozytorów, wykonawców i instrumentów, w przeważającej mierze mechanicznych, może pojawić się jeszcze jeden gracz.

Dziesiąta Beethovena

„Wiele elementów układanki doprowadziło nas do miejsca, w którym jesteśmy dzisiaj” – mówi Matthias Röder. Jako dyrektor Instytutu Karajana w Salzburgu, kierował projektem „Beethoven X – Projekt Sztucznej Inteligencji” w 2021 roku, który był szeroko komentowany na całym świecie. Wyzwanie: ostateczne dokończenie niedokończonych szkiców X Symfonii Beethovena. Miało to zostać osiągnięte za pomocą tzw. architektury transformatorowej, w której sztuczne sieci neuronowe zostały wytrenowane w celu wykrywania statystycznych akumulacji kombinacji.

„Podobnie jak w przypadku słów, istnieje związek przyczynowo-skutkowy między nutami” – wyjaśnia Röder, a model transformatorowy mapuje prawdopodobieństwa: to znaczy, która nuta, oparta na charakterystycznym stylu Beethovena, najprawdopodobniej wystąpiłaby po poprzedniej, gdyby sam skomponował utwór. W tym celu sztuczna inteligencja otrzymała utwory samego Beethovena, a także utwory jego współczesnych; następnie przedstawiono jej zachowane szkice kompozytora do X Symfonii i poproszono o ich dalsze rozwinięcie.

Zespół ekspertów w końcu przeanalizował utwór, poddał go gruntownej edycji i stworzył kolaż. Reakcje na ostateczną premierę pełnej wersji symfonii były równie kontrowersyjne, co ciekawe. „Były fragmenty, w których słuchacze mówili: Beethoven nigdy by jej nie skomponował w ten sposób. I to właśnie te fragmenty były oryginalne dla Beethovena” – mówi Röder z uśmiechem.

Röder postrzega sztuczną inteligencję jako „narzędzie i partnera do walki”, które można wykorzystać do wspaniałych eksperymentów, między innymi do znalezienia odpowiedzi na pytanie: Jak działa ludzka kreatywność i co ją definiuje? „Dyskusja napędzana strachem niczego nie osiągnie” – mówi Röder, choć przyznaje, że wciąż istnieje wiele powodów do wyjaśnień, jeśli chodzi o wykorzystanie sztucznej inteligencji. „Wielu nadal postrzega sztuczną inteligencję jako rodzaj czarnej skrzynki, która potrafi mówić. Ale nie jest to byt, a jedynie maszyna statystyczna, która działa w oparciu o to, co my, ludzie, powiedzieliśmy lub ułożyliśmy”.

„Tylko ludzie potrafią to zrobić”

Ali Nikrang, profesor sztucznej inteligencji i tworzenia muzyki na Uniwersytecie Muzycznym w Monachium i współpromotor futurystycznego koncertu opisanego powyżej, bada, jak najlepiej wykorzystać tę maszynę statystyczną w praktyce muzycznej. „Komputery są bardzo szybkie w porównaniu z ludźmi. Zawsze interesowało mnie pytanie, jak mogłyby nam pomóc w komponowaniu” – mówi Nikrang. Nie widzi sprzeczności między oryginalnością artystyczną a suchymi statystykami.

Rzeczywiście, ludzie nie komponują w próżni, lecz są pod wpływem otaczającej ich muzyki, tradycji i wpływów kulturowych. Nie jest też niczym nowym pojmowanie muzyki jako kompozycji struktur. „Mozart już w swojej »Muzycznej grze w kości« losowo łączył różne frazy, a Carl Philipp Emanuel Bach również eksperymentował z fragmentami” – mówi Nikrang.

W przeciwieństwie do ludzi, sztuczna inteligencja nie posiada jednak filtrowanej percepcji, która mogłaby dokonać oceny estetycznej. Dla badacza stanowi to również szansę: „Sztuczna inteligencja może dać nam nowe spojrzenie na muzykę. Dysponuje nieskończoną ilością danych, ale nie kategoryzuje ani nie ocenia – to zaleta”. Na swoim stanowisku on i jego studenci trenują sztuczną inteligencję, wykorzystując szeroką gamę utworów muzyki klasycznej. Ostateczne pytanie brzmi: „Co możemy zrobić z pomocą sztucznej inteligencji, co byłoby artystycznie interesujące i ekscytująco nowe?”

Sztuczna inteligencja jest już w stanie skomponować utwór, który brzmi mniej więcej spójnie, jak Mozart czy Haydn. „Ale to nie jest szczególnie interesujące dla kompozytora. Bardziej interesuje go: Gdzie jestem w muzyce? Jak mogę wykorzystać sztuczną inteligencję, aby nie tylko naśladowała, ale była dla mnie użyteczna jako osoby z moim pragnieniem ekspresji?” – mówi Nikrang. Nie postrzega sztucznej inteligencji jako zagrożenia dla wrodzonej ludzkiej kreatywności. Zagrożone są tylko obszary, które koncentrują się wyłącznie na naśladownictwie. W większości przypadków to ludzie nadal są decydującym czynnikiem na końcu łańcucha. Powód: Chociaż maszyna potrafi wymyślić różne scenariusze muzyczne, nie jest w stanie rozpoznać, który z nich może być istotny dla ludzkości. „To zależy od kontekstu społecznego – tylko ludzie potrafią to zrobić” – mówi Nikrang.

Do ćwiczeń

Współczesna technologia powinna ułatwiać życie muzykom w sposób konkretny, praktyczny i możliwie najmniej biurokratyczny. Tak uważa Boian Videnoff, dyrektor artystyczny Mannheim Philharmonic i założyciel aplikacji Enote. Podobnie jak wielu jego kolegów, spędził dekady taszcząc w teczkach stosy nut z koncertu na koncert, przenosząc sprawdzone palcowania ołówkiem do innych wydań i mozolnie przeszukując archiwa w poszukiwaniu różnych wydań. Teraz korzysta wyłącznie z cyfrowych nut.

Na potrzeby aplikacji on i jego zespół opracowali technologię, która pozwala na przekształcanie oryginalnych drukowanych utworów muzycznych w pliki w pełni zdigitalizowane. Działa to w następujący sposób: wydrukowany utwór muzyczny jest skanowany, a następnie uzyskany obraz jest przesyłany do sztucznej inteligencji. Analizuje ona symbole tworzące obraz – „wszystko, co jest czarne”, jak mówi Videnoff. Sztuczna inteligencja poprawnie przypisuje teraz ponad 99 procent tych symboli.

„Jakość zależy od ilości danych treningowych, którymi dysponuje sztuczna inteligencja” – mówi Videnoff. Aby znaleźć pozostałe odchylenia, potrzeba nie tylko więcej danych treningowych, ale także dużej społeczności, słynnej inteligencji roju, która pomoże je skorygować – czyli, ponownie, ludzi. „W przeciwnym razie nie jest to opłacalne” – mówi Videnoff. Pośrednim krokiem na tej drodze są tak zwane „inteligentne pliki PDF”, w których struktura stron jest ustalona w notacji, ale sztuczna inteligencja potrafi już rozpoznawać powtórzenia i zdania lub zaznaczać poszczególne głosy. Dla solisty, który na przykład musiał zaznaczyć zakreślaczem partię operową na setkach stron, aby lepiej ją przećwiczyć, to z pewnością ulga.

Kiedy Videnoff mówi o możliwościach, jakie mogą otworzyć się w przyszłości, wpada w euforię. Ostatecznym celem, w najlepszym przypadku, jest „w pełni modyfikowalny dokument, z którym inne technologie również będą mogły się połączyć” – zachwyca się Videnoff. „Szaleństwa” byłyby wówczas możliwe – na przykład, gdyby sztuczna inteligencja słuchała muzyki i „przewracała stronę” w idealnym momencie; a nawet zaznaczała niepoprawnie wykonane fragmenty.

Videnoff i jego współpracownicy postrzegają fundament swojej twórczości, same dzieła, jako „wspólną własność”. Świat wydawniczy jest pod presją, a Videnoff liczy na umowy licencyjne. Przedstawiciele wydawnictw, tacy jak Ester Petri, dyrektor zarządzająca Carus Verlag, i Paul Schäffer z Schott Verlag w Moguncji, który opublikował już dzieła Beethovena, postrzegają tę kwestię nieco inaczej.

Jeśli chodzi o digitalizację nut, to i tutaj coś się dzieje: od czasu pandemii wydawnictwo Carus Verlag sprzedaje również cyfrowe pliki PDF, a sprzedaż ta stanowi obecnie około czterech procent całego rynku. „Wciąż jest tu wiele do poprawy” – mówi Petri, dodając, że wielu amatorów, zwłaszcza tych z nut drukowanych, nadal śpiewa i gra na instrumentach. W firmie Schott popyt również rośnie „powoli i systematycznie, ale bynajmniej nie gwałtownie” – mówi Paul Schäffer. „Zakładamy, że będziemy traktować muzykę drukowaną i cyfrową na równi przez co najmniej kolejne dziesięć lat. Niemniej jednak przygotowujemy się na możliwy punkt zwrotny i obecnie rozpoczynamy kompleksowy projekt skanowania, aby zdigitalizować około 5 milionów stron naszych szablonów produkcyjnych”.

Obaj rozumieją fascynację aplikacją taką jak Enote, ale wciąż pozostaje wiele do wyjaśnienia. „Problem polegał na tym, że firma początkowo nie traktowała nas, wydawców, jako partnerów i ignorowała implikacje praw autorskich związane z korzystaniem z naszych produktów wydawniczych” – mówi Schäffer. Petri dodaje: „Potrzebne jest jasne rozwiązanie prawne w postaci umów. Jako wydawcy zależy nam na tym, jak precyzyjnie opracowujemy muzykę – jak najdoskonalej i jak najbardziej praktycznie. Wymaga to dużej wiedzy muzycznej”.

Z głębi wieków

W opactwie Saint-Pierre de Solesmes w północno-zachodniej Francji można przekonać się, jak digitalizacja może wzbogacić świat muzyki. Benedyktyni modlili się, pracowali i śpiewali tu od tysiącleci, ale w ostatnich latach wydarzyło się coś encyklopedycznego. W latach 2019-2022 realizowany był szeroko zakrojony projekt nagraniowy, którego efektem jest aplikacja Neumz. Zawiera ona pełne śpiewy gregoriańskie z trzyletniego cyklu Novus Ordo, dostępne teraz wszędzie i o każdej porze.

Ponadto zespół ekspertów pracuje nad digitalizacją całego archiwum Solesmes, wykorzystując specjalnie wyszkoloną sztuczną inteligencję dla DIMM, Archiwum Obrazów Cyfrowych Muzyki Średniowiecznej w Oksfordzie. W tym celu skanowanych i katalogowanych jest 400 000 stron rękopisów i około dwóch milionów śpiewów. Szacuje się, że w trakcie tego gigantycznego procesu zostanie odkrytych ponad 4000 śpiewów, które będzie można usłyszeć (ponownie) po raz pierwszy od ponad 1000 lat.

„Przyszłość z przeszłości” to hasło projektu, w ramach którego długo ukryte skarby z głębin klasztoru wychodzą na światło dzienne i są systematycznie przetwarzane z wykorzystaniem najnowocześniejszych technologii. Kierownikiem całego projektu jest John Anderson. Uważa on, że możliwości otwierane przez zastosowanie sztucznej inteligencji są „fascynujące, a jednocześnie upiorne” – mówi. W przypadku Archiwów Solesmes, inteligencja techniczna pomaga w realizacji zadania, które w innym przypadku byłoby nadludzkie. „Ten klasztor to jedyne miejsce na świecie o tak dużej gęstości materiałów z czasów średniowiecza” – mówi Anderson.

Wszystkie te transkrypcje są obecnie transkrybowane z wykorzystaniem sztucznej inteligencji, aby w przyszłości udostępnić je muzykologom na całym świecie jako materiał cyfrowy i umożliwić ich wykonywanie na koncertach. Jednak bez ingerencji i inteligencji człowieka, niewiele z tego działa. Dlatego muzykolodzy początkowo transkrybowali rękopisy ręcznie, aby uzyskać wystarczającą ilość materiału szkoleniowego dla sztucznej inteligencji.

Na tej podstawie sztuczną inteligencję wyszkolono do tłumaczenia starożytnych manuskryptów na cyfrowe nuty. To niezwykle złożone zadanie – obarczone wieloma błędami. „80 procent materiału transkrybowanego w ten sposób jest poprawne” – mówi Anderson. Ostateczne uzupełnienie i korekta błędów muszą zostać ponownie przeprowadzone przez badaczy. W ten sposób ludzie i maszyny współpracują, aby przenieść wartościowe kompozycje z przeszłości do teraźniejszości. „Wszystko, co mamy dzisiaj, opiera się na tej muzyce” – mówi Anderson. Chorał gregoriański jest źródłem, a gdy tylko zetkniesz się z muzyką, która ma niekiedy ponad tysiąc lat i odkryjesz ją na nowo, zyskujesz fundamentalnie inne zrozumienie znaczenia czasu i rytmu.

Cyfrowa sala koncertowa

Ostatecznie muzyka ma oddziaływać na ludzi, a nikt nie potrafi tego zrobić bardziej intensywnie niż oni sami. Digitalizacja i coraz powszechniejsze wykorzystanie sztucznej inteligencji zdają się nie mieć na to wpływu. W niektórych przypadkach jest wręcz przeciwnie; w końcu technologie cyfrowe umożliwiły transmisję muzyki na cały świat bez znaczącej utraty jakości. Olaf Maninger, wiolonczelista i dyrektor ds. mediów Berlińskiej Filharmonii od 1994 roku, doświadczył tego na własnej skórze. Wiodąca niemiecka orkiestra zawsze była obeznana z technologią, co w dużej mierze zawdzięcza Karajanowi jako dyrygentowi, który ją kształtował. Kiedy w latach 90. coraz trudniej było uzyskać nagranie lub nagranie utworu symfonicznego, Maninger wpadł na pewien pomysł.

„Wtedy chcieliśmy zaprojektować sieć bezpieczeństwa, która uniezależniłaby nas od wytwórni płytowych i nadawców. A potem pojawił się internet” – wyjaśnia Maninger. Jego wizja: każdy koncert Berlińskiej Filharmonii będzie transmitowany na cały świat, a następnie dostępny w dowolnym momencie w archiwum. To, co dziś brzmi oczywisto, dla wielu wtedy było szaleństwem; w końcu nie było smartfonów ani aplikacji. „Ale było jasne, że internet ma niesamowity potencjał. Więc po prostu zaczęliśmy i mieliśmy nadzieję, że technologia nas dogoni” – mówi Maninger.

Dzięki wsparciu dużego banku, zespół techniczny zainstalował odpowiednią technologię nagrywania w Filharmonii Berlińskiej i uruchomił projekt pilotażowy. Dziś koncerty elitarnej orkiestry są dostępne w doskonałej jakości nagrań na wszystkich urządzeniach, a powstała w ten sposób Cyfrowa Sala Koncertowa jest zdecydowanie najpopularniejszą platformą streamingową w sektorze koncertów muzyki klasycznej. Jest ona teraz w pełni samowystarczalna.

Życie i praca Berlińskiej Filharmonii zmieniły się diametralnie dzięki dodatkowemu wymiarowi medialnemu – na lepsze, jak mówi Maninger. „Koncerty na żywo to nasza wizytówka i na zawsze pozostaną w naszych archiwach. To sprawia, że jako muzycy czujemy się jeszcze bardziej odpowiedzialni”. Świadomość, że oprócz 2400 osób w sali, aż 15 000 osób na całym świecie słucha ich interpretacji na żywo, daje im „super kopa” podczas grania.

Od momentu powstania Cyfrowej Sali Koncertowej fani na całym świecie nie tylko śledzą wydarzenia Filharmoników Berlińskich, ale także nawiązują z orkiestrą więź. „Kiedy potem przychodzą na nasze koncerty w Nowym Jorku czy Tokio, stają się już częścią rodziny” – mówi Maninger. Fakt, że ludzie wciąż przychodzą na koncerty pomimo doskonałej transmisji, wcale nie dziwi muzyka. „W taki wieczór dochodzi do niesamowitej interakcji energii. Sala trzeszczy od napięcia, ekscytacji i oczekiwania, a potem muzycy wkraczają w tę aurę i może nastąpić jedna z tych wyczekiwanych, magicznych chwil” – mówi Maninger. Emocje towarzyszące występom na żywo są po prostu niezastąpione.