Alexey Grigoriev, Gründer und Entwickler der Lernplattform Datatalks.club, wollte eigentlich bloss die Website AI Shipping Labs von der aktuellen Version auf statischen Github-Seiten nach
AWS migrieren, dies in vier Schritten vom Umzug der statischen Seiten bis zur Umstellung der Domain auf Django,
wie er in seinem Blog erklärt. Die Migrationsstrategie sei vernünftig gewesen, resümiert Grigoriev, aber die Umsetzung habe zu Problemen geführt.
Gregory hat sich nämlich über Gebühr auf Anthropics KI-Agenten Claude Code verlassen. Dieser hat "aus Versehen" die gesamte Produktionsinfrastruktur der Learning-Management-Plattform gelöscht, wobei Daten aus zweieinhalb Jahren Betrieb verloren gingen. Hausaufgaben, Projekte, Leaderboards für alle auf der Plattform beherbergten Kurse – alles weg. Um das Unheil vollständig zu machen, wurden auch sämtliche Snapshots gelöscht. Die Wiederherstellung der Datenbank gelang in nützlicher Frist nur mit Hilfe des AWS-Supports mit Expresszuschlag.
Die Ausführung der Migration hat Grigoriev Claude Code überlassen, der dazu Befehle für das Infrastructure-as-Code-Tool Terraform absetzte. Die Basis war eine bestehende Terraform-gemanagte Infrastruktur aus einem anderen Projekt. Statt für AI Shipping Labs ein separates Setup aufzusetzen, hat der Plattformgründer die neue Infrastruktur der bestehenden hinzugefügt, laut eigenen Angaben aus Kostengründen.
Zwar habe ihm Claude Code davon abgeraten, alles zusammenzunehmen, und stattdessen eine separate neue Infrastruktur vorgeschlagen – aber eben, er wollte Geld sparen. Mit dem Entscheid gegen eine neue Infrastruktur stiegen die Komplexität und das Risiko, was sich schon bald zeigte: Da das Ganze kürzlich auf einen neuen Server umgestellt wurde, ging Terraform davon aus, dass noch nichts existierte, und begann mit der Einrichtung einer neuen Infrastruktur. Das wollte Grigoriev jedoch nicht und wies Claude Code an, die neu erstellten Ressourcen wieder zu löschen.
Und da passierte das Malheur: Claude Code identifizierte die duplizierten Ressourcen, begann sie über die AWS-Kommandozeile zu löschen, stiess dabei aber auf Probleme. In der Folge entschloss sich der Agent, statt der
AWS CLI mithilfe des Befehls Terraform Destroy gleich alles auf einmal zu löschen. Dies wiederum hatte zum Resultat, dass nicht nur die neu erstellten Ressourcen, sondern die gesamte Infrastruktur gleichsam dem Erdboden gleichgemacht wurde. Es war danach sehr aufwendig, die Daten aus Backups wiederherzustellen und die Infrastruktur neu aufzusetzen.
Grigoriev kam zum Schluss, dass der Fehler auf seiner Seite lag. Er habe sich zu sehr auf den KI-Agenten verlassen, um die Terraform-Befehle zu generieren, und die Commands Plan, Apply und Destroy einfach an Claude Code delegiert. Damit sei die letzte Sicherheitsschicht weggefallen. In Zukunft will die Ausführung von Befehlen nicht mehr einen KI Agenten überlassen und jeden Plan manuell sichten, bevor er ausgeführt wird.
(ubi)