Modell und Realität

Effektive Reproduktionszahl Reff

Beim Umgang mit einer Epidemie ist die effektive Reproduktionszahl Reff eine hilfreiche Kenngröße. Sie beschreibt in einer Zahl das Ansteckungsverhalten der Krankheit: Wie viele Personen steckt eine infizierte Person durchschnittlich im Laufe ihrer Erkrankung insgesamt an. Wenn Reff größer als 1 ist, wächst die Anzahl der Neuerkrankungen, wenn Reff kleiner als 1 ist, gehen die Neuerkrankungen zurück. Zum Beispiel hieße Reff=2, dass sich die Anzahl der Neuinfizierten bei jedem Krankheitszyklus verdoppelt, und somit exponentiell ansteigt.

Reff ist keine fixe Konstante, sondern ändert sich und hängt von vielen Faktoren ab:
Einerseits von Faktoren, auf die wir keinen Einfluss haben (wie z.B. den Eigenschaften des Virus selbst), und andererseits von Gegenmaßnahmen, die bereits getroffen wurden.

Um die Wirksamkeit von derartigen Maßnahmen zu beurteilen, wäre es sehr hilfreich, den zeitlichen Verlauf von Reff genau zu kennen.

Reff lässt sich aber nicht direkt ermitteln, da wir meist nicht wissen, wer wen angesteckt hat. Stattdessen wird versucht, Reff aus der Folge der täglich neu positiv getesteten Personen zu schätzen. Dem liegt ein mathematisches Modell zu Grunde, das versucht, unser Wissen über die Dynamik von Ansteckungen möglichst genau zu erfassen.

Ein international häufig verwendetes Basismodell wird im Abschnitt Mathematische Grundlagen beschrieben. Dieses Modell, und die sich daraus ergebende Berechnungsmethode, wurde von Cori et al. (2013) entwickelt und ist in der Software EpiEstim implementiert. Diese Methode wird für die Berechnung zweier der Schätzwerte, die auf der "Aktuelle Zahlen"-Seite (linke Graphik) zu sehen sind, verwendet. Die daraus resultierende Schätzung ist abhängig von verschiedenen Eingabeparametern, die wir hier noch im Detail beschreiben. Die Kredibilitätsintervalle, die auf der Startseite zu sehen sind, wurden auf Basis einer von der London School of Hygiene & Tropical Medicine (LSHTM) entwickelten Erweiterung von EpiEstim berechnet.

Parameter τ

Aufgrund zufälliger und systematischer Schwankungen der Anzahl der Neuerkrankungen (z.B. gibt es am Wochenende meist weniger Meldungen) lässt sich Reff für einen einzelnen Tag nur ungenau bestimmen. EpiEstim arbeitet daher mit der Annahme, dass Reff über mehrere, nämlich τ Tage konstant war, und errechnet sozusagen ein "gemitteltes" Reff für diese Tage.

Ob τ dabei groß oder klein gewählt wird, wirkt sich auf das Verhalten des Schätzwertes aus. Kleine Werte von τ haben den Vorteil, dass man Änderungen von Reff zeithnäher ablesen kann, während der Schätzwert für größere Werte von τ robuster gegenüber zufälligen Schwankungen der gemeldeten positiven Fälle ist. In unseren Graphiken präsentieren wir zum einen Schätzwerte aufgrund von τ=13. Dieser Wert entspricht der von der AGES getroffenen Parameterwahl. Zum anderen zeigen wir auch die Ergebnisse zu dem in der Literatur (siehe z.B. Cori et al. (2013)) ebenfalls verwendeten Wert τ=7.

Der Effekt, dass ein großes τ zu einer stärkeren Glättung der der Schätzwerte für Reff führt, lässt sich auf der linken Graphik der Startseite gut erkennen (blaue versus grüne Kurve).

Wir wollen den Unterschied zwischen der Wahl von τ=13 und τ=7 auch mithilfe eines fiktiven Beispiels inllustrieren: Man kann das EpiEstim zu Grunde liegende Modell auch simulieren, und eine zufallsbeeinflusste Folge von virtuellen Fallzahlen generieren. Als Eingabewert gibt man dabei für jeden Tag den Wert von Reff vor. Die folgende Graphik zeigt eine solche Folge von virtuellen Fallzahlen. Die "virtuelle Epidemie" verläuft hier in drei Phasen. Zunächst ist Reff=2.2, dann Reff=0.6 und schlussendlich Reff=1.3.

Verlauf der virtuellen Fallzahlen einer modellierten Epidemie
Virtuelle Fallzahlen einer modellierten Epidemie

Entsprechend dieser Wahl von Reff in den drei abgebildeten Intervallen entwickeln sich die Zahlen der infizierten Personen. Im ersten Intervall sehen wir ein rasantes exponentielles Wachstum. Beim plötzlichen Übergang von Reff=2.2 zu Reff=0.6 sinken die Fallzahlen sprunghaft, um dann im weiteren Verlauf des zweiten Intervalls exponentiell abzufallen. Beim Übergang vom zweiten zum dritten Intervall verhält sich die Situation ähnlich, aber in die umgekehrte Richtung.

Wenn man auf Basis dieser generierten Fallzahlenfolge nun mit Hilfe von EpiEstim das (bekannte, da vorgegebene) Reff berechnet, dann sind das sozusagen perfekte Bedingungen, da ja sämtliche Modellannahmen von EpiEstim erfüllt sind — sämtliche außer einer: Zu den Zeitpunkten wo Reff seinen Wert ändert, also hier am 11.10. und am 25.10., und einige Zeit danach, ist die Modellannahme, dass Reff über τ Tage konstant gewesen ist, nicht erfüllt. Den Effekt, den diese verletzte Modellannahme auf die Schätzung von Reff mittels EpiEstim hat, sieht man sehr deutlich in der folgenden Graphik, wo der tatsächliche (vorgegebene) Verlauf von Reff und die mittels EpiEstim berechneten Schätzungen (samt Kredibilitätsintervallen) eingetragen sind. Sprünge im tatsächlichen Verlauf von Reff werden zu "Rampen" in den Schätzern. Der tatsächliche Wert wird vom Schätzer erst mit τ Tagen Verzögerung erreicht.

Geschätzter und tatsächlicher Verlauf von R in einer modellierten Epidemie
grünR (EpiEstim, τ=7)
blauR (EpiEstim, τ=13)
grauR (vorgegeben)
Vorgegebenes Reff und mittels EpiEstim berechnete Schätzungen für Reff für eine modellierte Epidemie. (Schattiert auch die 90%-Kredibilitätsintervalle)

Zeitliche Verzögerung

In der Realität kann sich die Schätzung von Reff sich aus verschiedenen Gründen nur auf die Vergangenheit beziehen: Nach einer Infektion dauert es mehrere Tage bis sich Symptome entwickeln, dann dauert es wiederum einige Tage bis getestet wird und das Testergebnis elektronisch registriert wird. Will man den Wert dem Tag zuordnen, an dem die relevanten Infektionen passiert sind, muss dieser daher um einige Tage in der Zeit zurückversetzt werden.

Beispiel: Wenn sich eine Person heute infiziert wird es einige Tage dauern, bis - falls überhaupt - eine Registrierung im Melderegister aufscheint. Manche Methoden (z.B. LSHTM) versuchen nun diese späteren Meldungen dem eigentlichen Infektionsdatum zuzuordnen. Dementsprechend, können sie nicht für den derzeitigen Tag einen Schätzwert bereitstellen, weil eben heute auftretende Infektionen erst in der Zukunft berichtet werden.

Um diesen Effekten Rechnung zu tragen, werden in unseren Graphen auf der Hauptseite die geschätzten Werte jeweils 10 Tage vor dem Datum des letzten verwendeten Datenpunktes eingetragen.

Um auszugleichen, dass über τ Tage gemittelt wird, könnte man auch noch um weitere Tage versetzen. In der letzten Graphik aus dem obigen Abschnitt würde das dazu führen, dass die geschätzten Werte von Reff insgesamt näher an den tatsächlichen Werten liegen. Allerdings mit dem möglicherweise unerwünschten Effekt, dass dann der Schätzwert bereits beginnt zu fallen, bevor sich Reff tatsächlich geändert hat. Um diesen Effekt zu vermeiden, versetzen wir nicht um weitere Tage zurück.

Achtung: Der zeitliche Versatz muss insbesondere beachtet werden, um die Vergleichbarkeit zwischen verschiedenen Schätzungen zu ermöglichen: Beipielsweise ist eine andere gebräuchliche Methode, die Schätzwerte jeweils dem letzten Tag zuzuordenen, von dem gemeldete Infektionszahlen in die Schätzung einbezogen wurden. Die verschiedenen Konventionen resultieren in einer zeitlichen Verschiebung.

Kredibilitätsintervalle

Das 90%-Kredibilitätsintervall (KI) für Reff gibt den Bereich an, in dem 90% der "plausiblen" Werte von Reff liegen (analog für das 50%-KI).

Sowohl EpiEstim, als auch die von LSTHM entwickelte Methode, verwenden Bayes-Schätzer für Reff. Hierbei werden verschiedene mögliche Werte von Reff damit gewichtet, wie plausibel diese bei der momentanen Entwicklung der Fallzahlen sind (genauer, wie wahrscheinlich es für das jeweilige Reff ist, dass wir die momentanen Fallzahlen beobachten). Eine genauere Beschreibung findet sich im Abschnitt Mathematische Hintergründe.

Bei der Interpretation von derartigen Schätzungen, und vor allem der angegebenen Kredibilitätsintervalle ist es wichtig zu beachten, dass diese nur die im Modell erfassten Unsicherheiten beschreiben.

Wir diskutieren dies zunächst am Beispiel des Algorithmus, der in EpiEstim implementiert ist: EpiEstim geht insbesondere davon aus, dass das serielle Interval genau bekannt ist und dass alle Infizierten selbst gleichermaßen infektiös sind. Es wird angenommen, das alle Infizierten positiv getestet werden und auch genau bekannt ist, an welchem Tag genau diese Infektion erfolgt ist. Weiters wird davon ausgegangen, dass Reff über einen Zeitraum von jeweils τ Tagen konstant war.

Die Implementierung der LSHTM-Gruppe (epiforcasts.io) ist bemüht, bestehende Modellunsicherheiten in mehrfacher Weise zu berücksichtigen: Es werden Unsicherheiten über die Länge des seriellen Intervalls mit einbezogen, das Datum der erfolgten Infektionen wird als stochastisch angenommen, und die Annahme über eine für jeweils τ Tage konstante Reproduktionszahl wird aufgeweicht. Die resultierenden Kredibilitätsintervalle sind in linken Graphik auf der Startseite dargestellt.

Wir bemerken, dass eine Reihe weiterer Unsicherheiten besteht: Man kann davon ausgehen, dass viele Infizierte (insbesondere aysmptomatische Infizierte) nicht positiv getestet werden. Weiters bestehen große Unsicherheiten darüber, wie unterschiedlich ansteckend verschiedene Personen sind, beziehungsweise wie stark sich das Verhalten von Personen auf deren Infektiosität auswirkt ("Superspreader"). Letzteres lässt auch die im Abschnitt mathematische Grundlagen genauer beschriebene Modellannahme, dass die Anzahl der täglich neu Infizierten poissonverteilt ist, fraglich erscheinen.