Backtesting Arena

Backtesting Arena

Zum Blog

Wann ist ein Backtest-Ergebnis vertrauenswürdig? Vier Fragen, die du stellen musst

Ein Backtest mit 34 % CAGR sieht beeindruckend aus. Aber ist das Ergebnis vertrauenswürdig? Vier Fragen entscheiden, ob ein Backtest ernst zu nehmen ist — von Total Return vs. CAGR über maximalen Drawdown bis zur Anzahl der Trades.

Backtesting Arena·20. Mai 2026·6 Min. Lesezeit·2 Aufrufe
Wann ist ein Backtest-Ergebnis vertrauenswürdig? Vier Fragen, die du stellen musst

Hohe Renditen sind leicht zu finden. Hier kommt, wie du erkennst, ob sie überhaupt etwas bedeuten.

Du hast einen Backtest laufen lassen. Das Ergebnis sieht gut aus. CAGR von 34 %. Trefferquote von 68 %. Gesamtrendite von 280 %.

Solltest du dem Ergebnis vertrauen?

Noch nicht. Nicht ohne vorher vier Fragen zu stellen.

Die meisten Backtest-Ergebnisse — auch die, die online gepostet werden, als Service verkauft werden oder hinter ganzen Newslettern stehen — fallen bei mindestens einer dieser Fragen durch. Zu verstehen, warum, trennt sinnvolle Recherche von Lärm.


1. Frage 1: Wie hoch ist die CAGR — nicht die Gesamtrendite?

Die Gesamtrendite ist die am häufigsten genannte Zahl in Trading-Inhalten. Sie ist gleichzeitig die mit dem geringsten Aussagewert ohne Kontext.

„Diese Strategie hat 450 % Gesamtrendite gebracht." Über welchen Zeitraum?

Sind es 20 Jahre, dann sind das ungefähr 8,5 % pro Jahr — leicht unter dem langfristigen Durchschnitt des S&P 500. Unbeeindruckend. Sind es 4 Jahre, sind das etwa 52 % pro Jahr — außergewöhnlich.

Gleiche Zahl. Komplett unterschiedliche Bedeutung.

Die CAGR (Compound Annual Growth Rate, durchschnittliche jährliche Wachstumsrate) löst dieses Problem. Sie zeigt die jährliche Rendite, bereinigt um den Zinseszinseffekt, unabhängig vom getesteten Zeitraum. Damit wird jeder Backtest auf gleicher Basis vergleichbar.

Die Formel: (Endwert / Startwert)^(1 / Jahre) − 1

Orientierungspunkte, die man kennen sollte:

  • S&P 500 langfristig: ungefähr 10 % CAGR
  • Bitcoin langfristig (ab 2015): über 60 % CAGR (mit extremer Volatilität)
  • Eine „gute" aktive Strategie: schlägt konstant den passenden Buy-and-Hold-Vergleich

Wenn dir jemand ein Backtest-Ergebnis zeigt, frag immer nach der CAGR. Wenn nur die Gesamtrendite gezeigt wird, versteckt entweder jemand etwas, oder die Person weiß nicht, was sie tut.


2. Frage 2: Wie hoch ist der maximale Drawdown?

Eine Strategie mit 34 % CAGR klingt exzellent. Aber was, wenn sie zwischendurch 72 % verloren hat, bevor sie sich erholt hat?

Hättest du das durchgehalten?

Die meisten nicht. Sie hätten am Tiefpunkt verkauft — den Verlust realisiert, die Erholung verpasst und am Ende schlechter dagestanden, als wenn sie nichts getan hätten.

Der maximale Drawdown ist der größte Rückgang vom Höchststand zum Tiefststand, den eine Strategie erlebt hat. Er beantwortet die Frage: „Was wäre die schlimmste Phase gewesen, die ich hätte überstehen müssen — und hätte ich sie wirklich ausgehalten?"

Die Mathematik wird bei hohen Drawdowns brutal:

  • 50 % Drawdown braucht 100 % Anstieg, um wieder bei null zu landen
  • 60 % Drawdown braucht 150 % Anstieg
  • 70 % Drawdown braucht 233 % Anstieg

Hohe CAGR mit hohem Drawdown ist keine gute Strategie. Es ist eine Strategie, die auf dem Papier funktioniert und in der Praxis die Disziplin zerstört.

Die Frage, die man sich vor jedem Backtest-Ergebnis stellen sollte: „Hätte ich den schlimmsten Drawdown, den diese Strategie je produziert hat, realistisch ausgehalten?"

Wenn die Antwort Nein ist — dann spielt die CAGR keine Rolle. Du hättest sie nie eingestrichen.


3. Frage 3: Schlägt die Strategie den richtigen Vergleich?

Hier fallen die meisten „Gewinner-Strategien" leise auseinander.

Der Standard-Vergleich ist Buy-and-Hold — am ersten Tag kaufen, halten, fertig. Einfach, keine Entscheidungen, keine Gebühren.

Aber dieses einfache Buy-and-Hold hat ein verstecktes Problem: Es unterstellt, dass du genau am Starttag des Backtests gekauft hast. Im echten Leben macht das niemand.

Wenn dein Backtest im Januar 2019 startet, kaufte Buy-and-Hold Bitcoin bei 3.500 $. Natürlich sieht fast alles gut aus im Vergleich zu diesem Einstieg.

Wenn dein Backtest im November 2021 startet, kaufte Buy-and-Hold bei 65.000 $. Plötzlich sieht jede Strategie wie ein Genie aus.

Gleiche Strategie. Gleiche Parameter. Komplett andere Schlussfolgerung — abhängig vom Startdatum.

Ein ehrlicherer Vergleich ist der Average B&H — die durchschnittliche CAGR über alle möglichen Einstiegspunkte, die noch genug Zeit hatten. Nicht der Glücks-Einstieg. Nicht der schlechteste. Der realistische Einstieg, den die meisten Anleger tatsächlich erleben würden.

Eine Strategie sollte den Average B&H schlagen, nicht nur die zufällig günstige Variante von Buy-and-Hold.

Und dann gibt es noch DCA — Dollar-Cost Averaging, also regelmäßig einen festen Betrag investieren. Das ist, was die meisten Anleger tatsächlich machen. Wenn deine aktive Strategie das langweilig-stetige DCA über einen sinnvollen Zeitraum nicht schlägt, ist die Komplexität den Aufwand nicht wert.

Drei Vergleiche. Drei Fragen:

  • Schlägt sie Buy-and-Hold (Tag eins)?
  • Schlägt sie Average B&H (realistischer Einstieg)?
  • Schlägt sie DCA (was die meisten tatsächlich machen)?

Eine Strategie, die alle drei besteht, ist wirklich interessant.


4. Frage 4: Auf wie vielen Trades basiert das Ergebnis?

Diese Frage überspringen die meisten — und sie ist oft die wichtigste.

Statistische Belastbarkeit braucht genug Datenpunkte, um echten Vorteil von Glück zu unterscheiden.

Eine grobe Orientierung:

  • Unter 10 Trades: praktisch bedeutungslos
  • 10 bis 30 Trades: schwaches Signal, große Vorsicht geboten
  • 30 bis 50 Trades: fängt an, aussagekräftig zu werden
  • 50+ Trades: solide Basis für eine Bewertung

Warum das wichtig ist: Bei 5 Trades kann eine Münzwurf-Strategie rein zufällig eine Trefferquote von 80 % zeigen. Bei 50 Trades gleicht sich Zufall aus. Bei 100+ Trades sieht man tatsächlichen Vorteil — oder dessen Fehlen.

Die Falle bei komplexen Strategien: Mehr Bedingungen = weniger Signale = weniger Trades = weniger Aussagekraft.

Eine Strategie, die verlangt „RSI unter 30 UND Preis über dem 200er-SMA UND Fear & Greed unter 25 UND Wochen-Candle grün geschlossen", erzeugt vielleicht nur 4 Signale in 5 Jahren. Das ist kein Backtest. Das sind vier Datenpunkte mit einer überzeugend wirkenden Geschichte drumherum.

Bevor du irgendeinem Backtest-Ergebnis vertraust: Auf wie vielen Trades basiert es?

Unter 30? Dann ist es eine Anekdote, kein Beweis.


5. Alles zusammen

Die vier Fragen, in der Reihenfolge:

  1. CAGR — nicht Gesamtrendite. Macht Zeiträume vergleichbar.
  2. Maximaler Drawdown — könntest du die schlimmste Phase realistisch durchstehen?
  3. Vergleich gegen die richtigen Benchmarks — schlägt die Strategie Buy-and-Hold, Average B&H und DCA?
  4. Anzahl der Trades — gibt es genug Datenpunkte, um dem Ergebnis zu trauen?

Ein Backtest, der alle vier Fragen besteht, ist nicht garantiert auch in der Zukunft erfolgreich. Kein Backtest ist das. Aber es ist ein Ergebnis, das man ernst nehmen kann — und es ist eine deutlich höhere Hürde, als die meisten Trading-Inhalte überhaupt nehmen.


Backtesting Arena zeigt alle vier Metriken automatisch — inklusive Average B&H und Trade-Anzahl. Keine Kreditkarte erforderlich. → tradingstrategies.work

Studiere die Vergangenheit, verbessere deine Zukunft.

Im nächsten Beitrag: Wir wenden diese Metriken auf reale Strategien mit echten Daten an — angefangen mit dem Golden Cross, einem der meistzitierten und am wenigsten getesteten Signale im Krypto-Trading.

FAQ:

Frage: Was ist der Unterschied zwischen CAGR und Gesamtrendite?

Antwort: Die Gesamtrendite ist die einfache Summe der Wertentwicklung über den gesamten Zeitraum (z. B. „die Strategie hat 450 % gemacht"). Sie sagt nichts darüber, wie lange das gedauert hat. Die CAGR (durchschnittliche jährliche Wachstumsrate) verteilt diese Rendite mathematisch auf einzelne Jahre, mit Berücksichtigung des Zinseszins. Sie macht Backtests über unterschiedliche Zeiträume direkt vergleichbar. Wer nur die Gesamtrendite zeigt, versteckt entweder etwas oder kennt sich nicht aus.


Frage: Warum reicht ein einfacher Buy-and-Hold-Vergleich nicht?

Antwort: Weil der Vergleichswert massiv vom Startdatum abhängt. Ein Backtest, der im Januar 2019 startet, vergleicht sich mit einem Bitcoin-Einstieg bei 3.500 $ — fast jede Strategie sieht im Vergleich gut aus. Ein Backtest, der im November 2021 startet, vergleicht sich mit einem Einstieg bei 65.000 $ — fast jede Strategie sieht wie ein Genie aus. Der Average B&H mittelt über viele realistische Einstiegspunkte und ist dadurch ein deutlich aussagekräftigerer Vergleich.


Frage: Ab wann ist die Anzahl der Trades statistisch ausreichend?

Antwort: Unter 10 Trades ist ein Backtest praktisch bedeutungslos — selbst eine Münzwurf-Strategie kann zufällig eine hohe Trefferquote zeigen. Zwischen 30 und 50 Trades wird das Ergebnis erst aussagekräftig. Ab 50+ Trades hat man eine solide Basis. Vorsicht bei komplexen Strategien mit vielen Bedingungen: Sie produzieren oft nur eine Handvoll Signale über mehrere Jahre, was statistisch keine Bewertung erlaubt — auch wenn die Geschichte drumherum überzeugend klingt.


Frage: Was ist Average B&H und wo finde ich diesen Wert?

Antwort: Average B&H ist die durchschnittliche CAGR über alle möglichen Einstiegspunkte innerhalb des Backtest-Zeitraums, die noch genug Restzeit für eine sinnvolle Auswertung hatten. Der Wert eliminiert die Verzerrung durch ein zufällig günstiges oder ungünstiges Startdatum. Backtesting Arena zeigt diesen Wert standardmäßig zu jedem Backtest an, parallel zum normalen Buy-and-Hold und zum DCA. Eine Strategie sollte idealerweise alle drei Vergleiche schlagen.

Jetzt selbst testen

Fahre den Backtest mit deinen eigenen Parametern und Zeiträumen.

Backtest starten →
📬

Don't miss new blog posts

One short email per new post — strategies, backtests, market analysis. No spam, unsubscribe with one click anytime.

By subscribing you accept our privacy policy. We use Resend for delivery. Double opt-in confirmation required.

Comments (0)

Join free to post comments.

Sign up →

No comments yet. Be the first!