Anlage 3 zu TRGS 910
Leitfaden zur Quantifizierung stoffspezifischer Expositions-Risiko-Beziehungen und von Risikokonzentrationen bei Exposition gegenüber krebserzeugenden Gefahrstoffen am Arbeitsplatz

1   Rahmen der Risikoquantifizierung

1.1   Vorbemerkung: Prinzipien der Risikoquantifizierung bei begrenzter Datenbasis

Der vorliegende Leitfaden soll die Voraussetzungen schaffen, um Expositions-Risiko-Beziehungen für krebserzeugende Stoffe nach harmonisierten Regeln zu beschreiben, und dabei die Option einschließen, Bezugswerte bei definiertem Risiko oder Arbeitsplatzgrenzwerte für diese Stoffe zu begründen. Dazu werden Kriterien aufgestellt, um die Eignung vorliegender Daten zu einem Stoff zu bewerten, und Vorgehensweisen empfohlen, aus diesen Daten bestmögliche Expositions-Risiko-Beziehungen zu ermitteln. Der Leitfaden stellt eine Aktualisierung eines im Ausschuss für Gefahrstoffe konsentierten, bereits publizierten und in der Bewertungspraxis genutzten Konzepts dar (AGS, 2008).
Der Schutz von Beschäftigten am Arbeitsplatz gegenüber krebserzeugenden Chemikalien (Kanzerogenen, Karzinogenen) wird insbesondere durch die EU-Richtlinie 2004/37/EG (Krebsrichtlinie) und durch die Gefahrstoffverordnung (GefStoffV) geregelt. Im Sinne der Krebsrichtlinie bezeichnet „Karzinogen“ einen Stoff, der die in Anhang I der Verordnung (EG) Nr. 1272/2008 genannten Kriterien für die Einstufung als krebserzeugender Stoff der Kategorie 1A oder 1B erfüllt. Krebserzeugende („karzinogene“) Stoffe der Kategorien 1A und 1B sind sowohl im Sinne der Krebsrichtlinie als auch nach der GefStoffV3) im Risikomanagement gleich zu behandeln. Es ist gemäß diesen Bestimmungen also unerheblich, ob ein Stoff aufgrund epidemiologischer Erkenntnisse (Kategorie 1A) oder aufgrund von Tierversuchen (Kategorie 1B) als krebserzeugend erkannt und eingestuft wurde. Da ein Krebsleiden als eine besonders gravierende Erkrankung anzusehen ist und da die Krebsrichtlinie davon ausgeht, dass ein Expositionsniveau, unterhalb dessen eine Gefährdung der Gesundheit nicht mehr gegeben ist, nicht festgelegt werden kann, sehen die rechtlichen Bestimmungen besonders weitgehende Schutzmaßnahmen gegenüber diesen Stoffen vor.
Wegen ihres unmittelbaren Bezugs zum Menschen sollen primär Daten aus Studien am Menschen zur Beschreibung von Expositions-Risiko-Beziehungen herangezogen werden. Allerdings sollte die Existenz solcher Daten insbesondere auch im Hinblick auf kanzerogene Wirkungen eine Ausnahme darstellen, da sie gleichzeitig einen unzureichenden (Arbeits-)Schutz dokumentieren. Bei vorhandenen Daten bestehen in der Epidemiologie vor allem bei älteren Studien Unsicherheiten bei der Abschätzung der Exposition, da in der Regel Messwerte für historische Belastungen fehlen und personenbezogene Expositions-Abschätzungen systematisch verzerrt sein können. Darüber hinaus ist bei epidemiologischen Beobachtungsstudien (nicht-interventionellen Studien) immer zu prüfen, ob der mögliche Einfluss von Störgrößen berücksichtigt wurde. Tierexperimentelle Daten können dagegen unter kontrollierten Bedingungen und gut definierten Expositionsbedingungen durchgeführt werden, allerdings mit dem Nachteil, dass Tierexperimente mit beschränkten Fallzahlen angelegt werden. Die daraus folgenden jeweiligen Einschränkungen in der Belastbarkeit der gefundenen Dosis-Wirkungs-Beziehung sollten entsprechend beachtet werden. Bei der Übertragung tierexperimenteller Befunde müssen außerdem die Speziesunterschiede in Hinblick auf Dosisäquivalente und Wirkungsmechanismen berücksichtigt werden.
Die Frage der Regulation für krebserzeugende Gefahrstoffe stellt sich jedoch unabhängig von der Eignung der Datenbasis. Das Risikomanagement muss dabei mit den vorhandenen, oft nicht ausreichend belastbaren Expositions-Risiko-Beziehungen einen Grenzwert festlegen. Daher sollten die Unsicherheiten für jede getroffene Entscheidung ermittelt und ausgewiesen werden. Selbst die Schlussfolgerung, dass die Datengrundlage nicht ausreicht, um eine quantitative Expositions-Risiko-Beziehung aufzustellen, ist möglich. Da zudem Kenntnisse über die Wirkmechanismen in die gewählte Expositionsmetrik und in die Bewertung der Form der beobachteten Expositions-Risiko-Beziehung einfließen können und bei der Risiko-Extrapolation berücksichtigt werden sollten, liegt im Ergebnis eine Reihe von Bewertungsmaßstäben mit unterschiedlicher Sicherheit vor.
In den Fachwissenschaften werden auch Mindestdosen als so genannte Wirkschwellen (oder auch „praktische“ Wirkschwellen) für krebserzeugende Stoffe diskutiert, d. h. Expositionsbereiche, unterhalb derer – z. B. aufgrund der wirksamen biologischen Schutz- und Reparaturmechanismen – eine Gefährdung als unwahrscheinlich gilt. Dies ist jedoch umstritten. Außerdem sind der Beweis und die Ermittlung solcher Schwellen methodisch problematisch (Lutz, 2000; Neumann, 2006a; b; c). Nur bei hinreichender Absicherung, die über Plausibilitätsüberlegungen hinaus (z. B. über den angenommenen Wirkmechanismus) auch eine quantitative Eingrenzung beinhaltet, bei welcher Expositionshöhe diese Wirkschwellen anzusiedeln sind, sind solche Erkenntnisse derzeit regulatorisch umsetzbar. Der quantitativen Risikoabschätzung in Verbindung mit Konventionen über Risikoakzeptanz kommt daher besondere Bedeutung bei der Festlegung von Grenzwerten für krebserzeugende Stoffe zu. Unter dem „Risiko“ ist dabei das über das Hintergrundrisiko hinausgehende absolute Lebenszeitrisiko bei einer bestimmten Exposition zu verstehen (genauere Definition: siehe Abschnitt 1.4 sowie Glossar).
Für das Verständnis von Risikobewertungen nach dem vorliegenden Leitfaden ist es wichtig, die Rahmenbedingungen und wissenschaftlichen Grenzen zu kennen, diese auszuweisen und die unter der gegebenen Datenlage getroffene Bewertung bis zur Schaffung einer besseren Datenlage zu akzeptieren. Während derzeit von wissenschaftlicher Seite weder ein „wahres“ Risiko und daher auch kein „wahrer“ Grenzwert ermittelt werden kann, muss das Risikomanagement die wissenschaftliche Bewertung als derzeit bestmögliche Ableitung und somit als „vermutlich wahr“ annehmen, um handlungsfähig zu sein. Da Expositions-Risiko-Beziehungen und Grenzwerte als vorweggenommene Gutachten und im Sinne der Vorsorge abgeleitet werden, ist diese Annahme, nicht zuletzt auch rechtlich, möglich.
Der vorliegende Leitfaden befasst sich mit den wissenschaftlich-methodischen Konventionen, die zur Überbrückung der Kenntnislücken im Bereich akzeptabler und gefahrenrelevanter (noch vorübergehend tolerierbarer) Expositionen gegenüber krebserzeugenden Stoffen verwendet werden sollen. Die Abwägung wirtschaftlicher Interessen und des gesellschaftlichen Nutzens von Technologien gegenüber gesundheitlichen Risiken von Beschäftigten ist nicht Gegenstand dieses Leitfadens (z. B. keine Kosten-Nutzen-Überlegungen; vgl. hierzu Cherrie et al. (2011)). Differenzierungen verschiedener Tumortypen beispielsweise nach Heilbarkeit oder Erkrankungsschwere (Ausmaß des Leids für den Betroffenen) werden nicht vorgenommen (vgl. hierzu Diskussion in Morfeld (2010) und Kalberlah et al. (2011)).
Es ist den Mitgliedern des AK Risikoableitung jedoch bewusst, dass bei der Auswahl von vielen Maßstäben (z. B. Adversitätsdefinition, zu Grunde gelegtes Vertrauensintervall, Einschluss oder Ausschluss von einzelnen Extrapolationsmodellen, Interpretation des Vorsorgebegriffs) implizit durch das Wissenschaftsverständnis Wertungen eingehen, die nicht alleine naturwissenschaftlich begründet sind.
Fußnote 3)
In der aktuellen Version der GefStoffV vom 26. November 2010 (BGBl. I S. 1643), geändert durch Artikel 2 des Gesetzes vom 28. Juli 2011 (BGBl. I S. 1622), werden noch die Kategorien nach Anhang IV der Richtlinie 67/548/EWG verwendet (Kategorie 1 für nachgewiesene Humankanzerogene, Kategorie 2 für tierexperimentell identifizierte Kanzerogene). Dies soll in einer Neufassung der GefStoffV voraussichtlich im Jahr 2015 angepasst werden.

1.2   Gültigkeit

(1) Die Regeln dieses Leitfadens beziehen sich ausschließlich auf eine Risikoquantifizierung für krebserzeugende Stoffe, die bei der Durchführung der Gefährdungsbeurteilung nach Gefahrstoffverordnung herangezogen werden soll. Sie sind speziell dann anzuwenden, wenn der anzunehmende Wirkmechanismus oder die Datenlage die Ableitung einer toxikologischen Wirkschwelle nicht zulässt und daher kein gesundheitsbasierter Arbeitsplatzgrenzwert (AGW) für krebserzeugende Stoffe nach § 2 Abs. 7 der GefStoffV aufgestellt werden kann.
Es werden jedoch auch Regeln für die Ableitung von Grenzwerten (AGW) bei „Schwellenwert-Kanzerogenen“ bereitgestellt (vgl. Abschnitt 5.3).
(2) Für den vorgesehenen Zweck sollen mit Hilfe dieses Leitfadens Expositions-Risiko-Beziehungen nach einheitlicher und transparenter Methodik geschätzt werden. Dabei geht es insbesondere um die Extrapolation von Risiken in den Niedrigrisikobereich bei limitierter Datenlage. An der Höhe des so ermittelten Risikos können sich Maßnahmen des Risikomanagements nach BekGS 910 orientieren.
Das Ergebnis dieser Risikoquantifizierung beinhaltet nicht nur eine Punktschätzung des Risikos, sondern bildet auch die Expositions-Risiko-Beziehung über einen weiten Bereich ab. Damit kann der Leitfaden auch bei Anwendung eines Drei-Bereiche-„Ampelmodells“ (zwei Zäsurpunkte, statt eines Grenzwertes)4) genutzt werden und die Expositions-Risiko-Beziehungen können die Aufstellung von „verfahrens- und stoffspezifischen Kriterien“ (VSK) unterstützen, die nach § 20 Abs. 4 GefStoffV bekannt gegeben werden.
(3) Die Begründung der Höhe eines sozial- und gesundheitspolitisch als Gefahr bezeichneten Risikos und/oder „akzeptablen“ Risikos ist nicht Gegenstand dieses Leitfadens. Diese Bezugswerte („Toleranzrisiko“, „Akzeptanzrisiko“) werden jedoch genannt, um methodische Verknüpfungen im Rahmen des Leitfadens darstellen zu können.
Es ist somit nicht Gegenstand des Leitfadens zu beantworten, bei welcher Risikohöhe die „Akzeptanz-“ oder „Toleranzkonzentration“ für krebserzeugende Stoffe liegen soll. Es soll jedoch möglich sein, regulatorisch relevante Zäsurpunkte in die ermittelte Expositions-Risiko-Beziehung einzufügen (z. B. für Maßnahmenkonzepte, die an eine bestimmte Risikohöhe geknüpft sind). Zudem sind Vergleiche zwischen krebserzeugender und nicht krebserzeugender Wirkstärke durchzuführen und (über diesen Leitfaden) methodisch zu begleiten.
Alle Risikoermittlungen beziehen sich im Übrigen auf das Auftreten einer Krebserkrankung sowohl bei tierexperimentellen Studien, bei denen (neben gestorbenen) auch die erkrankten Tiere erfasst werden, als auch bei Humandaten, für die ebenfalls Inzidenzdaten von Krebserkrankungen gegenüber Mortalitätsdaten bevorzugt werden. Die Frage der Heilbarkeit von Tumorerkrankungen wird bei der Risikoermittlung und -bewertung bewusst nicht berücksichtigt.
(4) Die Methodik dieses Leitfadens ist nicht dafür vorgesehen, tatsächliche Häufigkeiten von Krebserkrankungen für eine reale Arbeitsplatzsituation vorherzusagen oder entsprechende Hochrechnungen auf Erkrankungshäufigkeiten in der exponierten Bevölkerung vorzunehmen.
Es soll ausdrücklich vermieden werden, dass die Risikoquantifizierungen missbräuchlich verwendet werden (z. B. um die Anzahl von expositionsbedingten Sterbefällen hochzurechnen). Die Expositions-Risiko-Modellierung, die Extrapolation auf niedrige Risiken und das unterstellte Expositionsszenario basiert auf bestimmten für eine harmonisierte Vorgehensweise in dem gegebenen Regulationsrahmen erforderlichen Konventionen, die jedoch nicht notwendigerweise für andere Zwecke adäquat sind. So müssen die nach diesem Leitfaden ermittelten Risikoquantifizierungen z. B. für die Berechnung eines Kompensationsanspruchs nach der Berufskrankheitenverordnung nicht geeignet sein.
Entsprechend können die in der BekGS 910 aufgeführten Konzentrationswerte (Akzeptanz- und Toleranzkonzentrationen) sowie die ihnen zugrunde liegenden ERB auch nicht Grundlage des Berufskrankheitenrechts sein und haben damit auch keine unmittelbare Bedeutung in entsprechenden Berufskrankheiten-Verfahren. Die den abgeleiteten ERB zugrunde liegenden wissenschaftlichen Erkenntnisse und die auf der Homepage der BAuA veröffentlichten Begründungen (Begründungen zu Expositions-Risiko-Beziehungen)5) können aber bei der Prüfung im Hinblick auf eine Einzelfallentscheidung eines Berufskrankheiten-Verfahrens herangezogen werden. Sie sind dann im Rahmen des geltenden Berufskrankheitenrechts hinsichtlich des Einzelfalls gesondert zu würdigen.
(5) Expositionsabschätzungen für einzelne Arbeitsplätze sind nicht Gegenstand dieses Leitfadens. Es wird ein Standardexpositionsszenario für einen Arbeitsplatz unterstellt („nominelles Risiko“; vgl. Abschnitt 4.5).
(6) Substanzbezug: international bestehen verschiedene Herangehensweisen dazu, ob eine Risikoquantifizierung nur für einen getesteten Einzelstoff gelten soll oder zugleich für eine Substanzgruppe, bei der das gleiche Wirkprinzip angenommen werden kann (auch wenn die Substanzen dieser Gruppe nicht notwendigerweise alle getestet wurden). In diesem Leitfaden erfolgt hierzu keine Festlegung. Die Vorgehensweise ist jedoch in der Einzelfallbewertung anzusprechen und zu begründen und soll neben dem qualitativen Aspekt („gleiches Wirkprinzip in einer Gruppe“) auch den quantitativen Aspekt (Vergleich der Bioverfügbarkeiten und Wirkstärken innerhalb der Gruppe) beinhalten.
Offensichtliches Beispiel für diese Fragestellung ist die Möglichkeit, bei Metallen nur die definierte Einzelverbindung, die tatsächlich getestet wurde, zu bewerten oder aus einer Gruppenbetrachtung nur begründete Fälle auszunehmen, eine in Deutschland häufige Vorgehensweise (z. B. „Blei und anorganische Verbindungen mit Ausnahme von…“). Eine allgemeingültige Regel zur Vorgehensweise liegt bisher nicht vor. In der Regel bezieht sich eine ERB auf die entsprechend eingestufte Substanz nach CLP mit der dort erkennbaren Substanzidentifikation.
Fußnote 4)
Vgl. BAuA-Forschungsprojekt F2010, 2005

1.3   Bedeutung der Standardannahmen (Defaultannahmen)

(1) Die Vorgaben in der Methodik dieses Leitfadens besitzen häufig Defaultcharakter, d. h. sie sind als Standard (Default) heranzuziehen, wenn keine stoffspezifischen Informationen ein Abweichen vom Default rechtfertigen. Sollten jedoch stoffspezifisch solche qualifizierteren Daten vorliegen, kann begründet von Standardannahmen abgewichen werden. Die Begründung ist zu dokumentieren (vgl. Abschnitt 9).
Erkenntnisse von geringer Relevanz reichen nicht immer aus, um ein Abweichen vom Default zu rechtfertigen. Zusätzliche Erkenntnisse können auch missbräuchlich für eine Risikoquantifizierung nach abweichender Methodik herangezogen werden: der hier offen gehaltene Ermessensspielraum („kann abgewichen werden“) erlaubt auch die Beibehaltung des Default und wird durch die geforderte Begründung eingegrenzt.
(2) In der Regel werden Schätzungen mit der relativ höchsten Wahrscheinlichkeit (zum Beispiel: geometrischer Mittelwert, Maximum Likelihood-Schätzung) zur Bildung des Default herangezogen.
Es wird ausdrücklich darauf verzichtet, bei allen Parametern „(reasonable) worst case“-Annahmen vorzusehen. Bei der Auswahl handelt es sich um einen schwierigen Abwägungsprozess, der jedoch transparent darzustellen ist. Das hier gewählte differenzierte Vorgehen wird vor dem Hintergrund der relativen Unsicherheit bei den im Rahmen der Methodik vorzunehmenden Extrapolationsschritten gewählt, die derzeit mit keinem wissenschaftlichen Verfahren (z. B. einer Probabilitätsrechnung) vermindert werden kann. Kombinationen mehrerer „worst case“-Annahmen würden zu einer Risikoquantifizierung mit sehr konservativem Charakter führen. Das Ergebnis lässt sich nicht validieren und verliert sich mit der Zahl solcher Annahmen zunehmend im Spekulativen. Um die Begründungsdiskussion auf die eigentliche Risikoschätzung zu zentrieren statt auf die geeignete Bemessung des objektiv nicht näher eingrenzbaren Unsicherheitsbereichs, wird im vorliegenden Rahmen die oben angegebene Konvention gewählt.
(3) Die Bewertung der Daten zu Einzelstoffen und die sich daraus ergebenden Schlussfolgerungen (zum Beispiel zum anzunehmenden Wirkprinzip, Ausmaß der Abweichung vom Defaultwert im Einzelfall) sind nicht Gegenstand dieser Methodik.
Das stoffspezifische Vorgehen erfolgt – soweit es vom hier formulierten Defaultvorgehen abweicht – nach Maßstäben, die für den Einzelstoff zu begründen sind.

1.4   Definition und Einordnung der Risikokonzentration6)

(1) Dieser Leitfaden befasst sich mit den Methoden der Berechnung einer Risikokonzentration. Die Risikokonzentration stellt einen unter bestimmten Annahmen und für die einleitend definierten Zwecke berechneten Konzentrationswert (Einheit: mg/m3, μg/m3 oder ng/m3) für das expositionsbedingte Lebenszeitrisiko im Szenario einer Exposition über das gesamte Arbeitsleben dar (definiertes Expositionsszenario; siehe Abschnitt 4.5). Das Lebenszeitrisiko gibt die Wahrscheinlichkeit an, im Laufe des Lebens an einer bestimmten Tumor- bzw. Krebsart zu erkranken, wenn die Sterblichkeit an anderen Ursachen ungefähr gleich ist wie in einer nicht-exponierten Population. Das zugehörige Risiko kann auch als (statistisch-mathematische) Schätzung des Exzess-Risikos bzw. als Additional Risk oder Extra Risk bezeichnet werden, da dabei die Hintergrundinzidenz entsprechend eingerechnet wird (s. Abschnitt 3.35 (3); 3.36; Glossar zu diesen Termini). Es werden üblicherweise mehrere Risikokonzentrationen für eine Substanz ausgewiesen, die jeweils unterschiedlich hohen Exzess-Risiken entsprechen.
Die Aussagekraft des aus den Daten eines Tierexperiments ermittelten Exzess-Risikos für ein Exzess-Risiko beim Menschen halten verschiedene Wissenschaftler für so gering, dass sie eine Risikoquantifizierung wegen zu großer Unsicherheiten auf dieser Basis ablehnen. Die Autoren dieses Leitfadens unterstützen für die Bewertung von Arbeitsplatzexpositionen gegenüber krebserzeugenden Stoffen mehrheitlich jedoch die Verwendung der Risikokonzentration mit der Zuordnung eines Exzess-Risikos, wobei ausdrücklich auf die Definition (expliziter Ausweis der Randbedingungen des berechneten Risikos und der Unsicherheit) und die Abgrenzung gegenüber einem tatsächlich beim Menschen beobachtbaren Risiko verwiesen wird.
Der Begriff Lebenszeitrisiko soll deutlich machen, dass die gesamte Zeitspanne bis ins hohe Alter betrachtet wird, wobei eine Verteilung der Lebenszeiten wie in einer Allgemeinbevölkerung oder in der Kontrollgruppe eines Kanzerogenitätsversuchs zugrunde gelegt wird (Becher und Steindorf, 1993). In der Praxis der quantitativen Risikoabschätzung bezieht sich die Ableitung des Risikos aber in der Regel auf ein ganz bestimmtes Alter, in Tierversuchen auf ungefähr zwei bis 2,5 Jahre, bei epidemiologischen Daten auf 70 bis 90 Jahre (z. B. 89 J.: Goldbohm et al. (2006); 85 J.: Attfield und Costello (2004); Rice et al. (2001); SCOEL (2003); Sorahan et al. (1998); Stayner et al. (1998; 2000); 80 J.: HEI-AR (1991); 75 J.: Stayner et al. (1995); Steenland et al. (2001)). Die statistische Lebenserwartung der heute 20jährigen Männer liegt bei 77 Jahren und die der Frauen entsprechend bei 82 Jahren (RKI, 2011). Nach der Sterbetafelmethode sollte das Krebsrisiko daher mindestens bis zum Alter von 80 Jahren berechnet werden.
Das Risikomanagement kann sich, zusätzlich zu den Risikokonzentrationen, auch auf das ALARA-Prinzip stützen (ALARA: „as low as reasonably achievable“). Das ALARA-Prinzip alleine wird als unzureichend eingeschätzt, um regulatorische Prioritäten zum Umgang mit krebserzeugenden Stoffen differenziert zu erarbeiten. Grundsätzlich kann das ALARA-Prinzip parallel verfolgt werden. Die Spezifizierung dieses Risikomanagement-Instruments ist aber nicht Gegenstand dieses Leitfadens.
(2) Statt durch Angabe einer „margin of exposure“ (MoE; vgl. z. B. (ECHA, 2012b) werden im vorliegenden Konzept die in (1) definierten Risikokonzentrationen mit zugeordnetem Exzess-Risiko ausgewiesen; dies ermöglicht die Quantifizierung des nominellen Risikos für einen breiten Bereich einer Expositions-Risiko-Beziehung.
Das Vorgehen, statt einem MoE ein quantifiziertes Risiko auszuweisen, resultiert auch aus dem Wunsch, als Maßnahmenbasis und zum Vergleich mit einem AGW (nichtkanzerogene Effekte) regelmäßig ein (angenommen) gleiches nominelles Risiko als definiertes Schutzniveau zu Grunde legen zu wollen. Hierfür ist eine MoE nicht ausreichend.
In der Chemikalienbewertung mit MoE wird im abschließenden Schritt der Risikocharakterisierung eine Quantifizierung vorgenommen (es wird der Abstand zwischen einer Prävalenz – z. B. als Benchmarkdosis bei 10 % – und der Expositionshöhe berechnet) und bewertet, also als „ausreichend“ oder „nicht ausreichend“ interpretiert. Bisher fehlen Regeln, wie sich eine über das Wirkprinzip (der „mode of action“) anzunehmende Nichtlinearität der Dosis-Risikobeziehung in dieser Risikocharakterisierung über das Abstandsmaß niederschlagen soll.
(3) Die Risikokonzentration als Bewertungskriterium unterscheidet sich im Verständnis von dem Konzept der „European Food Safety Authority“ (EFSA). Nach dem EFSA-Konzept ergibt sich eine Punktschätzung (Angabe einer ausreichend sicheren Dosis oder Konzentration), während im vorliegenden Konzept die Expositions-Risiko-Beziehung mit Gültigkeit über einen Expositionsbereich definiert wird.
Während sich die Risikokonzentration am durchschnittlichen Risiko orientiert (empfindliche Personen sind implizit, jedoch bei abweichendem individuellen verbleibenden Risiko, geschützt, wenn das Risiko für durchschnittlich empfindliche Personen ausreichend gering ist), wird beim Konzept der EFSA versucht, den Schutz von empfindlichen Personengruppen durch Sicherheitsfaktoren explizit zu berücksichtigen. Bei ausreichender Höhe der Sicherheitsfaktoren wird – ähnlich dem Verständnis bei Annahme einer Wirkschwelle – kein noch verbleibendes Risiko ausgewiesen (vgl. EFSA, 2005), obwohl dieses noch vorliegen kann.
Bei den Leitfäden für die Erstellung eines „Stoffsicherheitsberichts“ (CSR) im Rahmen der Chemikalienpolitik (REACH) wird bei der Ausweisung eines DMEL („derived minimal effect level“) entweder eine Risikokonzentration genannt (hier vorgesehenes Verfahren) oder alternativ die Herangehensweise nach EFSA (modifiziert) angewandt. Das EFSA-Verfahren ist ursprünglich für die Beschreibung eines erforderlichen Abstandes zwischen Prävalenz im experimentellen Szenario und Expositionshöhe nach oraler Aufnahme vorgesehen und nicht für den Arbeitsplatz bestimmt (andere Sicherheitsfaktoren), kann jedoch entsprechend angepasst werden. Für die Höhe der im modifizierten EFSA-Verfahren herangezogenen Sicherheitsfaktoren (Interspeziesvariabilität, Intraspeziesvariabilität, weitergehende individuelle Unterschiede in Krebsabwehrmechanismen) fehlen derzeit unterstützende statistische Daten oder Regeln. Verwendete Konventionen (z. B. 1 % Risiko für empfindliche Personen avisiert) wären gesellschaftlich zu konsentieren. Es wäre auch erforderlich, Maßstäbe zu erarbeiten, wie substanzspezifisch vom Default-Vorgehen abgewichen werden kann, wenn qualifiziertere Angaben vorliegen (Differenzierung im Vorgehen für verschiedene „modes of action“). Der nach dem modifizierten EFSA-Verfahren standardmäßig berechnete Wert (DMEL) kann jedoch mit einem Ergebnis identisch sein, das nach dem ERB-Konzept berechnet wurde. Für die Anwendung der Risikokonzentration und die Transformation in einen DMEL im Rahmen von REACH und/oder den ECHA-Leitlinien zu REACH fehlt derzeit der gesellschaftliche Konsens zu einer tolerablen und/oder akzeptablen (nominellen) Risikohöhe. Zur kritischen Bewertung des EFSA-Konzepts und der Maßstäbe für die DMEL-Ableitung vergleiche auch Püringer (2010; 2011).
Fußnote 6)
In der Vorläuferversion dieses Leitfadens wurde unspezifischer der Begriff: „Krebsrisikozahl“ statt „Risikokonzentration“ verwendet

1.5   Datenbasis

(1) Sofern Humandaten zur Risikoquantifizierung vorliegen, sind diese prioritär auf ihre Eignung zur Risikoquantifizierung zu prüfen und ggf. heranzuziehen, jedoch ist die Datenqualität (Erkrankungsdaten, Expositionsverlauf) zu berücksichtigen. Risikoquantifizierungen auf epidemiologischer Basis und auf tierexperimenteller Basis sind vergleichend gegenüber zu stellen (Plausibilitätskontrolle).
(2) Die Vorgehensweise nach diesem Leitfaden berücksichtigt, dass in der Mehrzahl der Fälle nur tierexperimentelle Daten als Basis der Risikoquantifizierung herangezogen werden können; entsprechend gelten die Festlegungen in diesem Leitfaden für tierexperimentelle Daten, jedoch werden Humandaten methodisch gleich behandelt, wenn keine anders lautende Vorgehensweise beim jeweiligen Quantifizierungsschritt angegeben ist.
(3) Nicht positive epidemiologische Studienergebnisse stellen in der Regel keinen Nachweis der Abwesenheit eines möglichen Risikos dar. Sie sind diesbezüglich mit der gebotenen Zurückhaltung und unter Berücksichtigung ihrer Eignung für die gegebene Fragestellung (statistische Power, Höhe der Exposition, Qualität der Expositionseinstufung) zu interpretieren.
Literatur: (Ahlbom et al., 1990; Wald und Doll, 1985)
Negative epidemiologische Daten können nur im Ausnahmefall zur Plausibilitätskontrolle eines positiven tierexperimentellen Befundes herangezogen werden, nämlich dann, wenn bei einer sehr umfangreichen Anzahl hochexponierter Personen die Abwesenheit entsprechender Tumoren dokumentiert ist. Zur Einordnung der Relevanz von Humandaten im Vergleich zum Tierexperiment vgl. auch Lavelle et al., (2012) und Goldbohm et al. (2006).

1.6   Datenqualität

(1) Bei gewährleisteter Mindestqualität (vgl. Abschnitt 8) können in der Regel Risikoquantifizierungen vorgenommen werden. Qualitätsmängel und die daraus resultierende Unsicherheit sind jedoch beim jeweiligen Schritt der Risikoquantifizierung zu dokumentieren.
Es können nicht immer Studien mit heute möglicher oder wünschenswerter Qualität als Grundlage für die Risikoquantifizierung vorausgesetzt werden. Zu Bewertungsunsicherheiten wegen solcher Qualitätsmängel der Datenbasis kommen durch das im Einzelfall vorhandene Evidenzniveau (das Zahl und Weite der Extrapolationsschritte bestimmt) bedingte Unsicherheiten hinzu, die inhärent im Prozess der Risikoquantifizierung bei unvollständigem Wissen enthalten sind. Datenabhängig ist der Grad der sich daraus ergebenden Gesamtunsicherheit fließend. Daher muss ein Kriterium dafür definiert werden, ab wann die Gesamtunsicherheit so groß ist, dass die resultierende Aussage als spekulativ und damit nicht mehr verwendbar anzusehen ist (vgl. Abschnitt 8). Der Umgang mit Unsicherheiten ist – darüber hinaus – bei dem jeweiligen Einzelschritt der Risikoquantifizierung und in Abschnitt 1.3 des Leitfadens festgelegt.

2   Diskussion des vorherrschenden Wirkprinzips

2.1   Wirkprinzip als Leitidee zur Risikoquantifizierung

(1) Erkenntnisse zu dem vorherrschenden Wirkprinzip („mode of action“) oder den vorherrschenden Wirkprinzipien bei der beobachteten krebserzeugenden Wirkung einer Substanz sind sowohl für die Ermittlung des „point of departure“ (Abschnitt 3) wie für die Durchführung der Extrapolation in den Bereich niedriger Risiken (Abschnitt 5) hilfreich. Entsprechend sind vor allem zu charakterisieren: a) die Art einer ggf. vorliegenden gentoxischen Wirkung, b) die Art nichtgentoxischer Ereignisse als Einflussgrößen auf den multifaktoriellen Prozess der Kanzerogenese, c) die jeweilige Bedeutung dieser Faktoren für das Wirkprinzip der Kanzerogenese und die Unsicherheit der entsprechenden Schlussfolgerung. Die Ergebnisse sind in geeigneter Weise zu dokumentieren (Abschnitt 9).

2.2   Mutagenität und Gentoxizität

Vorbemerkungen: Die Begriffe Mutagenität und Gentoxizität werden für Schadwirkungen am Erbgut der Zellen verwendet, sind aber nicht synonym: Mutagenität bezieht sich auf permanente vererbbare Veränderungen (Mutationen) in Nachkommen oder in Menge und Struktur der DNA von Zellen. Der breitere Begriff Gentoxizität umfasst auch Schäden, die selbst noch keine Mutationen darstellen, aber bei weiterer Prozessierung ein Potential zu deren Bildung haben. Definitionen (Mutagenität, Klastogenität, Aneugenität und Gentoxizität) vgl. auch Glossar (Abschnitt 10.1).
Im regulatorischen Kontext werden Befunde aus genetischen Toxizitätstests als Indiz für mögliche Kanzerogenität für die Einstufung genutzt, wenn (noch) keine Tierversuchsdaten zur Kanzerogenität vorliegen. Bei Vorliegen positiver Kanzerogenitätsstudien spielen sie zudem eine wichtige Rolle bei der Evaluierung des Wirkprinzips (MoA; „Mode of Action“) in Hinblick auf die Extrapolation von Dosis-Wirkungs-Zusammenhängen für Tumor-Risiken.
Regulatorische Leitfäden („Guidance Documents“, u. a. (ECHA, 2012a; EFSA, 2005; SCHER/SCCP/SCENIHR, 2009)) betonen die Bedeutung mechanistischer Informationen im „cancer risk assessment“. Für nicht-gentoxisch wirkende Krebsrisikofaktoren („Tumorpromotoren“) wird davon ausgegangen, dass es Wirkschwellen gibt, unterhalb derer sie keine (adversen) Effekte auslösen. Für nicht-gentoxische Kanzerogene sowie bei Formen der Gentoxizität, die über proteinvermittelte Mechanismen induziert werden (z. B. einige Ursachen der Aneuploidie) kann – gestützt durch entsprechende MoA-Evidenz – von einer linearen Extrapolation in den Niedrigdosisbereich abgewichen werden (ECHA, 2012a; EFSA, 2005).
Frühere Bewertungskonzepte gingen davon aus, dass jede von DNA-reaktiven Substanzen bzw. Metaboliten ausgelöste Mutation das Risiko der Krebsentstehung erhöht und daher eine lineare Extrapolation in den Niedrig-Dosis-Bereich begründet sei. Inzwischen wird aber von ECHA (2012a) und SCHER/SCCP/SCENIHR (2009) auch diskutiert, ob einzelne DNA-Veränderungen gänzlich ohne Konsequenz bleiben könnten, wenn ihre Häufigkeit geringer ist als die, mit der dieselben Veränderungen auch als Hintergrundschäden auftreten, oder wenn Reparatursysteme die zusätzlichen Schäden eliminieren können und hierfür „eine Vollständigkeit angenommen werden kann“. Auch in diesen Fällen könnte, soweit sie durch experimentelle Befunde gestützt werden, von einer linearen Extrapolation in den Niedrigdosisbereich abgewichen werden (ECHA, 2012a; EFSA, 2005).
Ein solches Abweichen von einer linearen Extrapolation ist nur dann gerechtfertigt, wenn konkrete (z. B. experimentelle) Daten vorliegen, die eine solche Abweichung auch quantitativ stützen (zur Vorgehensweise vgl. Abschnitt 5).
Für die Annahme einer Nichtlinearität oder einer Schwelle bei mutagenen Substanzen reicht in der Regel eine phänomenologische Begründung allein nicht aus (etwa: „keine Mutagenität bei niedrigen Konzentrationen gesehen“; „sublinearer Verlauf bei Mutationen durch Modellierung der Daten bestätigt“). In diesem Fall sind umfassendere Analysen zur Plausibilität vollständiger Reparaturen oder zur konsequenzlosen DNA-Veränderung im Rahmen der Begründung darzulegen. Dies dürfte jedoch nur im Ausnahmefall möglich sein, so dass eine Nichtlinearität (Sublinearität) eher als Dosis-Wirkungsmodell zugrunde zu legen ist als eine Wirkschwelle.
Ferner ist zu bedenken, dass Wirkschwellen nicht notwendigerweise im Hochdosisbereich liegen, sondern sich bereits in so niedriger Dosis befinden können, dass für den relevanten Extrapolationsbereich die Linearitätsannahme noch immer angemessen sein kann.
Schließlich ist der häufige Fall hervorzuheben, dass mehrere Wirkprinzipien gleichzeitig und in Kombination auftreten können (zur Vorgehensweise vgl. Abschnitt 5).
Beispiele
Für Arsen ist zwar aufgrund des beobachteten Wirkprinzips eine Wirkschwelle anzunehmen7). Da eine solche angenommene Wirkschwelle derzeit aber nicht quantifiziert werden kann und da diese bei sehr niedrigen Expositionshöhen zu liegen scheint, erfolgte eine lineare Extrapolation der ERB für kanzerogene Effekte.
Eine Nichtlinearität der Dosis-Wirkungs-Beziehung im niedrigen Konzentrationsbereich (in vitro) bei Mutationen durch alkylierende Substanzen wurde z. B. von Doak et al. (2007) gefunden. In der Studie handelt es sich um Substanzen, die sehr gut untersucht wurden. Bei einigen dieser Substanzen wurde jedoch auch die Linearitätsannahme bestätigt. Die Autoren nehmen eine Homöostase aufgrund von DNA-Reparaturen bei niedriger Exposition an, die unterschiedlich effektiv sein könne.
Auch bei Ethylmethansulfonat (Verunreinigung in einem AIDS-Medikament) wurde eine Nichtlinearität für mutagene Effekte beschrieben (Gocke und Müller, 2009; Gocke und Wall, 2009; Müller und Gocke, 2009).
Für weitere Hinweise vgl. z. B. Greim und Albertini (2012).
(1) Es ist zu prüfen, ob eine wirkmechanistisch direkte (primäre) Interaktion der Substanz mit dem Erbgut belegt oder aufgrund anderer Informationen anzunehmen ist. Wirkmechanistisch indirekte (sekundäre) Gentoxizität (z. B. über oxidativen Stress, Interferenz mit dem mitotischen Prozess, Inhibition der Topoisomerase, Inhibition der DNA-Reparaturenzyme usw.) ist von der primären Gentoxizität (direkte DNA-Interaktion wie Interkalation oder Adduktbildung und Mutationen durch Muttersubstanz bzw. Metaboliten) zu unterscheiden. Bei indirekter (sekundärer) Gentoxizität kann mit höherer Wahrscheinlichkeit eine Nichtlinearität der Expositions-Risiko-Beziehung begründet werden.
Bei primär gentoxischen Substanzen wird auch zwischen solchen, die direkt DNA-reaktiv sind und solchen, die es erst nach Bioaktivierung sind, differenziert. Gemäß neuerem internationalem Sprachgebrauch wird der Begriff „indirekt“ hier aber nicht in Bezug auf eine Bioaktivierung verwendet, sondern synonym für sekundäre Gentoxizität. Diese Unterscheidung in primäre und sekundäre Mechanismen der Gentoxizität ist auch in der Fachliteratur gebräuchlich. Es werden Substanzen mit „direct DNA reactive versus nondirect DNA reactive mechanisms“ differenziert (Dearfield et al., 2011; ECHA, 2012a), also Substanzen mit der DNA selbst als Target oder mit Nicht-DNA-Zielmolekülen.
Beispiele
  • für primär (direkt) gentoxische Stoffe sind Aflatoxine, Alkylantien, Nitrosamine und PAKs, die entweder selbst oder nach Bioaktivierung die DNA modifizieren und mutagen wirken.
  • für sekundär (indirekt) gentoxische Stoffe sind (Hydro-)Chinone und Redox-aktive Metalle, die oxidativen Stress auslösen, Spindelgifte (Vincristin) oder Topoisomerase-Hemmer (Doxorubicin, Etoposid) und Inhibitoren von DNA-Reparaturenzymen (u. a. Arsen, Cytosinarabinosid).
Die Qualität und die Absicherung der Einschätzung gentoxischer Eigenschaften ist zu charakterisieren (Differenzierung nach In vivo-, In vitro-Befunden, Kompatibilität der vorliegenden Studienergebnisse, Einfluss des Dosisbereichs in vorliegenden Tests, Information über Lücken).
In-vivo- und in-vitro-Tests mit mehreren Dosen sind in der Regel nicht dazu ausgelegt, „no effect levels“ abzuleiten, sondern dienen der Identifizierung eines gentoxischen Potentials („hazard“). Doch die Größenordnung, bei der gerade noch messbare Effekte auftreten, kann in Einzelfällen eine hilfreiche Information für eine Risikoableitung sein, u. a. bei der Frage, inwieweit im Niedrigdosisbereich noch Gentoxizität erwartet wird (oder nicht), und ggf. die Art der Extrapolation stützen. Bei manchen Formen der Gentoxizität (z. B. Aneuploidien) können Mindestschadstoffkonzentrationen angenommen werden, die erforderlich sind, um Krebs zu erzeugen. Befunde aus validen In-vivo-Gentoxizitätstests sind für Rückschlüsse auf das Wirkprinzip besonders wertvoll.
(2) Informationen zur Gentoxizität (Art der Gentoxizität, Qualität und Absicherung der Erkenntnisse) können im Hinblick auf eine Spezifität am Zielorgan, in dem Tumorigenität beobachtet wurde, wesentlich sein.
Bei der Bewertung von Gentoxizitätstests ist zu bedenken, dass bis zu 80 % der Stoffe, die negativ in Kanzerogenitätstests an Nagern sind, in einem oder mehreren In-vitro-Tests positiv sind (Kirkland et al., 2005; Matthews et al., 2006). Vor allem zytogenetische Tests mit Säugerzellen (Chromosomen-aberrationstests, Mikrokerntests und Maus-Lymphom-Tests) zeigen eine hohe Sensitivität, aber nur eine geringe Spezifität (irrelevant positiv), und haben daher nur begrenzte Aussagekraft in Hinblick auf die Übertragbarkeit der Befunde auf die zu bewertende In-vivo-Situation. Hierfür gibt es in Abhängigkeit vom verwendeten In-vitro-Testsystem und von der Substanzklasse verschiedene Gründe, die in Übersichtsarbeiten dargelegt sind (Dearfield et al., 2011; Kirkland und Müller, 2000). Eine deutlich bessere Spezifität für Nagerkanzerogene zeigen Mutagenitätstests in Bakterien (Ames-Test) und Säugerzellen (HPRT-Test).
(3) Die Relevanz der Ergebnisse von In-vitro-Gentoxizitätstests ist anhand der in den Tests verwendeten Bedingungen (z. B. Vergleich der Dosis-Wirkungs-Beziehungen von Gentoxizität und Zytotoxizität, Hochdosiseffekte) und der Struktur des untersuchten Stoffs zu prüfen. Gegebenenfalls sollten Struktur-Wirkungs-Beziehungen miteinbezogen werden. Bei systemisch wirkenden Kanzerogenen geben im Zweifelsfall die Ergebnisse von validen In-vivo-Tests den Ausschlag. Bei lokal wirkenden Kanzerogenen sind negative In-vivo-Tests nur dann aussagekräftig, wenn gezeigt wird, dass das Zielorgan erreicht werden kann.
Fußnote 7)
Es liegt eine ERB-Begründung als Entwurfsfassung vor, in der das Wirkprinzip erläutert wird. Das Dokument war bei Verabschiedung dieses Leitfadens noch nicht durch den AGS verabschiedet.

2.3   Bedeutung von Keimzellmutagenität

(1) Das Thema „Keimzellmutagenität“ selbst ist nicht Gegenstand des Leitfadens. Doch kann bei Vorliegen von Keimzellmutagenität auch Somazellmutagenität vorausgesetzt werden.
Alle bislang bekannten Keimzellmutagene sind auch in somatischen Zellen in vivo mutagen wirksam. Substanzen, die in somatischen Zellen mutagen sind, können vererbbare Schäden auslösen, wenn sie selbst oder ihre aktiven Metabolite das Erbgut in Keimzellen erreichen. Umgekehrt darf gefolgert werden, dass Substanzen, die in somatischen Zellen in vivo keine Mutationen auslösen, auch keine Keimzellmutagene sind.
Eine Nichteinstufung nach Muta 1A,1B oder 2 (gemäß CLP-Verordnung (EG) Nr. 1272/2008) hat für die Frage des Wirkprinzips bei der Kanzerogenität keine Relevanz.

2.4   Nichtgentoxische Ereignisse

(1) Informationen zu nichtgentoxischen Effekten mit möglicherweise ursächlichem Einfluss auf den Prozess der Kanzerogenese sind zu erfassen und zu beschreiben sowie der ermittelte Dosisbereich mit den krebsauslösenden Dosierungen zu vergleichen. Zu nennen sind insbesondere Zytotoxizität (z. B. Reizung, Entzündung, Nekrose), induzierte Zellproliferation, rezeptorvermittelte Prozesse, Proteinbindung, direkte hormonelle Wirkung, indirekter Einfluss auf Hormonregelkreise, Organspezifität und Geschlechtsspezifität. Auch toxikokinetische Informationen (z. B. Enzyminduktion, Sättigung bzw. neue Metaboliten spezifisch bei hoher Dosis) sind in diesem Sinne für den Prozess der Kanzerogenese relevant.
(2) Die Qualität und die Absicherung der Einschätzung nichtgentoxischer Eigenschaften ist zu charakterisieren (Differenzierung nach In-vivo-, In-vitro-Befunden, Kompatibilität der vorliegenden Studienergebnisse, Einfluss des Dosisbereichs im vorliegenden Tests, Information über Lücken).
(3) Informationen zu nichtgentoxischen Ereignissen (Art des Effekts, Qualität und Absicherung der Erkenntnisse) sind insbesondere in Bezug auf die Relevanz im Zielorgan, in dem Tumorigenität beobachtet wurde, zu bewerten.
(4) Die Überlegung, ob die Gentoxizität bei einem kanzerogenen Prozess „keine“ oder „eine untergeordnete“ Rolle spielt, beinhaltet eine nicht eindeutig abgrenzbare Abwägung. Als qualitative Kriterien, zumindest eine untergeordnete Gentoxizität anzunehmen, gelten:
  • Es liegen positive Befunde zu primärer Gentoxizität in vivo vor,
  • es liegt sekundäre (oder auch primäre) Gentoxizität bei niedrigen Konzentrationen in vitro vor (im Vergleich zur Zytotoxizität; mikromolarer und evtl. nanomolarer Bereich),
  • die vorliegenden Daten mit negativem Befund zur Gentoxizität besitzen keine hohe Qualität (als Defaultannahme, weil dann Relevanz der positiven Hinweise nicht auszuschließen ist).
    Andererseits kann eher keine Gentoxizität (statt untergeordnete Gentoxizität) angenommen werden oder ein gentoxischer Einfluss bei dem kanzerogenen Prozess als „nicht hinreichend wahrscheinlich“ angesehen werden, wenn
  • die Gentoxizität nur in vitro und nicht in geeigneten In-vivo-Studien gefunden wurde (negative In-vivo-Studien),
  • keine in vitro Daten mit (primären oder sekundären) gentoxischen Effekten aus qualifiziert durchgeführten Studien in sehr niedrigen Dosierungen vorliegen,
  • nur sekundäre Gentoxizität nur in höheren Konzentrationen/Dosierungen in vivo beobachtet wurde,
  • die Annahme einer fehlenden Gentoxizität zu den Erkenntnissen zum Wirkprinzip passt,
  • die Datenlage gut ist und nicht für einen Mechanismus spricht, der durch Gentoxizität beeinflusst ist.
    Dieser Abwägungsprozess kann im Zweifelsfall bei Verdachtsstoffen (Kanz. Kat. 2 gemäß CLP-Verordnung (EG) Nr. 1272/2008) eher in Richtung „keine“ Gentoxizität entschieden werden, während bei eindeutigen Kanzerogenen (Kanz. Kat. 1A oder 1B gemäß CLP-Verordnung) das Bewertungsergebnis: „keine Gentoxizität“ durch eine unzweifelhafte Datenlage gestützt sein sollte.
    Hintergrund für diese Entscheidungshilfe ist der Hinweis in der Begründung der MAK-Werte für Kanzerogene der Gruppe III, 4, nach der dort Kanzerogene zusammengefasst sind, bei denen „gentoxische Effekte … keine oder nur eine untergeordnete Rolle spielen“ (DFG, 2012). Abweichend von DFG differenziert dieser Leitfaden das weitere Vorgehen (z. B. mögliche Schwelle bei „keine Rolle“ oder Knickfunktion bei „untergeordnete Rolle“).

2.5   Bedeutung einzelner Einflüsse im multifaktoriellen Geschehen

(1) Im Sinne eines „weight of evidence“ sind die Bedeutung der primären und/oder sekundären Gentoxität (siehe 2.2) und nichtgentoxischer Ereignisse (siehe 2.4) auf den Prozess der Kanzerogenese abzuschätzen. Der oder die zentralen Einflussfaktoren auf das Krebsgeschehen sind darzustellen und deren vermutete Bedeutung für den Menschen zu begründen.
(2) Ergebnis kann auch eine, je nach Tumorlokalisation und/oder Dosisbereich differenzierte, Unterscheidung der anzunehmenden Wirkprinzipien sein. Das Vorliegen mehrerer (möglicher) Wirkmechanismen ist kenntlich zu machen.
(3) Das Vorliegen prämaligner Effekte (wie die Bildung von Foci in der Leber) ist zu prüfen und deren Dosis-Wirkungs-Beziehung nach Möglichkeit zu beschreiben.
(4) Hintergrundraten und das Auftreten spontaner Tumoren in der Kontrollgruppe sind bei der Diskussion des Wirkprinzips einzuordnen.

2.6   Zielgerichtete Schlussfolgerung

(1) Die Erfassung des Informationsstands mündet in folgenden Aussagen:
  • postuliertes Wirkprinzip
  • Schlüsselereignisse (beobachtete, Übereinstimmung mit Wirkprinzip)
  • Dosis-Wirkungs-Zusammenhang
  • zeitliche Assoziation
  • Stärke des Zusammenhangs, Konsistenz der Daten für diese Schlussfolgerung, Spezifität der Assoziation
  • biologische Plausibilität
  • andere mögliche Wirkprinzipien
  • Vertrauen in die Einschätzung
  • Datenlücken, Unsicherheiten
(2) Es ist insbesondere zu beantworten:
  • Ist die Beweiskraft ausreichend, um im Tierexperiment ein Wirkprinzip zu benennen?
  • Sofern von einer grundsätzlichen Annahme der Übertragbarkeit der Versuchstierbefunde auf den Menschen abgewichen werden soll: Kann die Humanrelevanz des Wirkprinzips auf Basis grundsätzlicher qualitativer Unterschiede in den Schlüsselereignissen zwischen Tier und Mensch mit hinreichender Wahrscheinlichkeit ausgeschlossen werden?
  • Und: Kann die Humanrelevanz des Wirkprinzips mit hinreichender Wahrscheinlichkeit auf Basis quantitativer toxikokinetischer und/oder toxikodynamischer Unterschiede zwischen Tier und Mensch ausgeschlossen werden?
  • Wie groß ist das Vertrauen in die abgegebene Einschätzung zum Wirkprinzip (Unsicherheiten sind zu benennen)?
Auch bei gentoxischen Ereignissen kann eine Sublinearität oder (in Ausnahmefällen) eine Wirkschwelle auftreten. Gentoxische Ereignisse sind unter diesem Blickwinkel zu differenzieren (vgl. TGD, Risk Characterisation, Abschnitt 4.14.3.4; Butterworth (2006)).
Auch nicht gentoxische Ereignisse können nicht immer mit einer Wirkschwelle verknüpft werden, z. B. ist bei einigen Rezeptor-vermittelten Prozessen die Angabe eines Wertes für eine solche Wirkschwelle nicht immer möglich (vgl. TGD, Risk Characterisation, Abschnitt 4.14.3.3; Butterworth (2006)).
Soweit für die Ermittlung der Bedeutung der verschiedenen Aussagen Angaben zur Expositions-Risiko-Beziehung im experimentellen Bereich erforderlich sind, besteht eine Sachinterdependenz zwischen Aufgaben nach Abschnitt 3 (Risikoquantifizierung) und Aufgaben nach Abschnitt 2 dieses Leitfadens (insbesondere 2.5 und 2.6: Expositions-Risiko-Beziehung). Entsprechend können die Positionen dieses Leitfadens nicht in strenger zeitlicher Abfolge bearbeitet werden.
Die angesprochenen Punkte unter 2.6 basieren auf Überlegungen der WHO (International Program on Chemical Safety, IPCS) und sind im Detail in Boobis et al. (2006) erläutert. Beispiele für die Vorgehensweise bei der Diskussion des Wirkprinzips finden sich z. B. in Kirman et al. (2004), Cohen et al. (2003), Preston and Williams (2005). Die grundsätzliche methodische Vorgehensweise, um den „mode of action“ zu erfassen, ist in Meek et al. (2003) und Seed et al. (2005) erläutert.
In verschiedenen Veröffentlichungen (z. B. Streffer et al.,(2004), Hengstler et al.,(2006), Bolt und Huici-Montagud,(2008), Foth et al., (2005) wurden ähnliche Differenzierungen des Wirkprinzips wie in der hier zugrunde gelegten Vorgehensweise gefordert. Sie werden in Abschnitt 5.1 dieses Leitfadens näher ausgeführt.
Neumann (2006a; b; c) begründet die Unmöglichkeit, bei krebserzeugender Wirkung eine eindeutige Schwelle zu finden und schlägt vor, den Begriff gänzlich zu vermeiden. Wegen der nicht vorliegenden besser kommunizierbaren Alternativen (Dieter und Konietzka, 2006) wird jedoch im vorliegenden Rahmen und mit den oben ausgeführten Einschränkungen im Verständnis der Begriff weiter geführt.

3   Risikoquantifizierung im Bereich beobachteter Krebsinzidenzen

3.1   Auswahl von Tierspezies, Geschlecht und Tumorlokalisation(en)

(1) Liegen Tumordaten zu mehreren der üblicherweise eingesetzten Tierarten vor, so ist die Tierspezies bevorzugt heranzuziehen, die am empfindlichsten reagiert.
(2) Bei der Auswahl der Tierspezies und der dort beobachteten Tumortypen und -lokalisationen ist jedoch abzuwägen, inwieweit eine quantitative Übertragbarkeit auf den Menschen angenommen werden kann. Eine Übertragbarkeit ist insbesondere dann anzunehmen, wenn die Tumorlokalisation im Speziesvergleich identisch ist und/oder Erkenntnisse zum „mode of action“ das Auftreten eines bestimmten Tumortyps (oder einer bestimmten Tumorlokalisation) stützen.
Tierexperimentelle Studien werden vor dem Hintergrund durchgeführt, dass qualitative und quantitative Übertragungen auf den Menschen (ggf. unter Berücksichtigung von Extrapolations- und/oder Korrekturfaktoren) prinzipiell möglich sind. Insofern ist grundsätzlich das tierexperimentelle Modell mit der größten Verwandtschaft zum Menschen zu bevorzugen. Im Falle des Nichtwissens darüber, welches Tiermodell im speziellen Fall dem Menschen am nächsten steht, ist ein konservatives Herangehen zu wählen. Dieses gilt grundsätzlich, auch wenn im Einzelfall Widersprüche aufgezeigt wurden: Bei 1,3-Butadien scheint der menschliche Metabolismus dem der weniger empfindlichen Ratte ähnlicher zu sein, als dem der empfindlicheren Maus. Werden jedoch epidemiologische und tierexperimentelle Risikoquantifizierungen gegenübergestellt, ist bei 1,3-Butadien eine größere Übereinstimmung des Krebsrisikos für Maus und Mensch zu beobachten (Roller et al., 2006). Dieser mögliche Widerspruch im Falle von 1,3-Butadien bedeutet, dass a) den Humandaten besonderes Gewicht zuzumessen ist (vgl. Abschnitt 1.5(1)), dass b) konservative Extrapolationsschritte wie die Annahme von Linearität im Niedrigrisikobereich nicht vorschnell wegen vermeintlicher mechanistischer Hinweise aufgegeben werden sollten, und dass c) die relative Empfindlichkeit von Versuchstieren gegenüber dem Menschen weitergehender Überprüfung bedarf.
(3) Eine im Tierexperiment beobachtete Tumorlokalisation, die von den Beobachtungen aus epidemiologischen Studien beim Menschen abweicht, spricht in der Regel nicht gegen deren Humanrelevanz (vgl. aber Hinweise unter 3.1 (6)). Die resultierende Risikoquantifizierung ist jedoch als unsicherer zu betrachten.
(4) Liegen erhöhte Tumorinzidenzen in beiden Geschlechtern vor, so sind in der Regel die Daten zu der Geschlechtergruppe mit der höheren Tumorrate heranzuziehen. Liegen die Tumorraten in beiden Geschlechtern etwa in gleicher Höhe, so ist zur Erhöhung der statistischen Absicherung eine Addition der Daten zu beiden Geschlechtern zulässig.
(5) Liegen Tumore in mehreren Organen vor, so sind die Daten zu allen Organen heranzuziehen, bei denen eine statistisch und/oder biologisch erhöhte Tumorzahl in einer Dosierung beobachtet wird, und/oder eine statistisch signifikante Dosis-Wirkungsbeziehung (ggf. auch nur als Trend) erkennbar ist.
Ausgewählt wird in der Regel die Tumorlokalisation, die zur niedrigsten Expositions-Risiko-Beziehung führt (vorsichtigste Risikokonzentrationen). Davon kann im Einzelfall begründet abgewichen werden (vgl. 3.1 (6)).
Es gibt eine Reihe typischer Tumorformen, die in bestimmten Nagerstämmen mit hoher, teilweise auch stark variabler Spontaninzidenz auftreten und deren Relevanz für den Menschen nicht feststeht (vgl. 3.1 (6)). Wenn deren Häufigkeit dosisabhängig gegenüber der aktuellen und der mittleren historischen Kontrolle erhöht ist, kann in der Regel von einem expositionsbedingten Effekt ausgegangen werden.
(6) Die Berücksichtigung oder Nichtberücksichtigung bestimmter Tumorlokalisationen (ggf. mit Einschränkung auf bestimmte Tierspezies oder -stämme) ist im Einzelfall abzuwägen. Die Nichtberücksichtigung bedarf einer Begründung. Als Hinweise für die Frage der (qualitativen und/oder quantitativen) Übertragbarkeit auf den Menschen gelten:
  • Eine (auch quantitative) Übertragbarkeit ist in der Regel gegeben, wenn es sich zugleich um eine gentoxische Substanz handelt und ein gentoxisches Wirkprinzip bei der Kanzerogenese als relevant eingeschätzt wird.
  • Eine Übertragbarkeit auf den Menschen wird gestützt, wenn die Bioverfügbarkeit der Substanz oder ihres Metaboliten im Zielorgan angenommen oder gezeigt werden kann. Bei der Abwägung, ob eine quantitative Übertragbarkeit angenommen wird, ist demnach die (beobachtete oder zu unterstellende) Konzentration der Substanz am Zielorgan einzubeziehen.
  • Bei fehlender oder eingeschränkter Bedeutung der Gentoxizität können mechanistische Erkenntnisse zum Wirkprofil im Speziesvergleich (z. B. Zytotoxizität, endokrine Aktivität) für die Einschätzung der Übertragbarkeit herangezogen werden.
  • Bei α2U -globulinbedingten Nierentumoren der männlichen Ratte ist keine (qualitative oder quantitative) Übertragbarkeit anzunehmen.
  • Eine Einzelfallabwägung ist insbesondere bei folgenden Tumorlokalisationen erforderlich, wenn die Gentoxizität beim Wirkprinzip keine dominierende Rolle spielt:
    • Lebertumoren nach PPARα-Stimulation („Peroxisomenproliferation“)
    • Leukämien der Fischer-Ratte
    • Phäochromocytome der Fischer-344-Ratte
    • Schilddrüsentumoren bei der Ratte
    • Leydigzelltumoren
    • Lebertumoren der B6C3F1-Maus
    • Vormagentumoren
    • Mesotheliome der Tunica albuginea bzw. Tunica vaginalis (männliche Ratten)
    • Harder´sche Drüse (Nickhautdrüse im Augenwinkel) und Zymbaldrüse (Ohrtalgdrüse)
  • Zur näheren Diskussion der Relevanz dieser Tumorlokalisationen und zur Einzelfallabwägung vgl. Abschnitt 8.3.
    Der rein qualitative Speziesvergleich ist für Einstufungen relevant, jedoch nicht für die hier betrachtete Ermittlung einer Expositions-Risiko-Beziehung und einer Risikokonzentration.
  • Auch ohne Gentoxizität sind alle anderen Lokalisationen und Tumorarten, Tumoren bei anderen als den genannten Tierspezies oder -stämmen in der Regel quantitativ übertragbar, teilweise jedoch mit erheblichen Unsicherheiten.
  • Liegen sowohl Tumorinzidenzen an a) Lokalisationen mit fraglicher Humanrelevanz und/oder fraglicher quantitativer Übertragbarkeit vor und an b) Lokalisationen mit eindeutigerer quantitativer Übertragbarkeit, so ist letzteren in der Regel der Vorzug bei der Risikoquantifizierung zu geben.
    Es ist zu prüfen, ob nicht auch andere Tumorformen aufgetreten sind, die nicht der Spontanpathologie zugeordnet werden können und deren Relevanz für den Menschen nicht oder weniger in Frage steht. Diese sind in der Regel bei der Risikoquantifizierung den Daten für unsichere Lokalisationen vorzuziehen, selbst wenn sie nicht in der vergleichsweise niedrigeren Konzentration zu beobachten sind.
    Eine ausführlichere Diskussion zu dieser Differenzierung befindet sich in Abschnitt 8.3.
(7) Die Tumorinzidenzen in den verschiedenen unter (5) und (6) genannten Organen sind in der Regel getrennt zu quantifizieren und vergleichend gegenüberzustellen. Der Risikoquantifizierung wird im Standardfall die Tumorlokalisation mit der niedrigsten T25 zugrunde gelegt (Dosis oder Konzentration, bei der in zusätzlichen 25 % der Tiere Krebs auftritt). Dabei wird die unterschiedliche Hintergrundrate bei der T25-Berechnung berücksichtigt. In Einzelfällen ist es jedoch geboten, auch verschiedene Tumorlokalisationen zusammenzufassen (Beispiel: Asbest – Mesotheliome und Lungentumoren). In solchen Fällen ist die Maßgeblichkeit der Gesamtinzidenz für die Risikoquantifizierung zu begründen.
Mit dem T25-Verfahren wird ausgehend von einer Konzentration mit signifikant erhöhter Tumorinzidenz durch lineare Interpolation (i) unter Berücksichtigung der Hintergrundinzidenz, (ii) gegebenenfalls unter Korrektur einer nicht lebenslangen Versuchsdauer, und (iii) unter Annahme einer vollständigen Resorption eine Dosis ermittelt, bei der die Inzidenz für diesen Tumor im Tierversuch 25 % bei lebenslanger Exposition beträgt (vgl. auch Glossar).
Mit der Berechnung von T25 oder BMD für mehrere Tumorlokalisationen, Geschlechter sowie mit und ohne gutartige Tumoren soll ermöglicht werden, in späteren Schritten parallel von mehreren POD aus und verknüpft mit einer differenzierten mechanistischen Diskussion in den Niedrigrisikobereich zu extrapolieren. Aggregationen (Zusammenfassungen von Befunden) sind insbesondere dann sinnvoll, wenn die Frage der Differenzierung verschiedener Dosis-Wirkungsbeziehungen (z. B. wegen der Homogenität der beobachteten Reaktionen) nicht im Vordergrund steht. So kann es sinnvoll sein, die Befunde bei einer einheitlichen Wirkungsweise eines Kanzerogens in verschiedenen Organen auch über verschiedene Tumorlokalisationen zu aggregieren. Im TGD der EU wird ausgeführt: „For a substance inducing more than one type of tumours, the determination of a dose-descriptor value is from each relevant tumour type rather than from the number of tumour bearing animals. If several relevant data sets on tumour-incidences are available, dose descriptors values should be derived for all these.“ (Abschnitt 4.14.2.3; EC, Technical Guidance Document, 2005). Verschiedene Hintergrundraten von Tumoren in verschiedenen Organen sprechen gegen eine Aggregation mehrerer Tumorlokalisationen.
Für eine differenziertere Betrachtung der Möglichkeiten zur Zusammenordnung von Tumoren für die Krebsrisikoberechnung argumentieren McConnell et al. (1986). U.S.EPA interpretiert diese Auswertung: „The incidence of benign and malignant lesions of the same cell type, usually within a single tissue or organ, are considered separately and are combined when scientifically defensible“ (Eine konkrete Auflistung, wann Zusammenordnungen vorgenommen werden können, wird in McConnell et al. (1986) gegeben).
Es wird also nicht das Prinzip vertreten, die Gesamtzahl der tumortragenden Tiere, gleich welcher Tumorlokalisation, aufzuaddieren.
Manche ältere Studien waren auch so angelegt, dass nur verdächtige Zielorgane ausgewertet wurden. Entsprechend selektive Studien können dennoch für die Risikoquantifizierung herangezogen werden, wenn sie kanzerogene Wirkungen erkennen lassen. Von Mehrfach-Tumoren (Multiplizität) werden in solchen Studien üblicherweise zusätzlich berichtet, wenn sie beobachtet wurden.
(8) Liegen in einem Organ/Gewebe mehrere Tumortypen vor, so ist in der Regel eine gemeinsame Betrachtung zu wählen. In begründeten Einzelfällen (z. B. Humanrelevanz nur eines Tumortyps) ist jedoch eine getrennte Betrachtung angezeigt.
(9) Liegen in einem Organ gutartige und bösartige Tumoren vor, so wird deren Inzidenz in der Regel addiert. Eine Addition verschiedener Tumortypen in einem Tier erfolgt jedoch nicht, da sonst eine Überschreitung der Gesamtinzidenz (bezogen auf das Organ > 100 %) eintreten kann. Liegen Hinweise darauf vor, dass z. B. eine Malignisierung eines gutartigen Tumors beim Menschen unwahrscheinlich ist, kann begründet auf eine entsprechende Addition verzichtet werden.

3.2   Auswahl eines „point of departure“

(1) Der „point of departure“ (POD: Ausgangspunkt für weitere Schritte der Risikoabschätzung) ist eine definierte Expositionshöhe mit Risikozuordnung auf der Konzentrations-Risiko-Funktion für eine Substanz. Der POD liegt auf oder nahe bei der Expositionshöhe (Konzentrationsbereich), zu der aus epidemiologischen oder aus tierexperimentellen Beobachtungen Daten über das Auftreten von Krebshäufigkeiten vorliegen. Für den POD wird das Risiko als Krebsinzidenz in Prozent der zugehörigen Konzentration (mg/m3) gegenübergestellt. Der POD ist ein normalisierter Wert. Unter „Normalisierung“ ist die Umrechnung auf Lebens(arbeits-)zeitexposition (vgl. Abschnitt 4.4), ggfs. die Pfad-zu-Pfad-Extrapolation auf den Inhalationspfad (vgl. Abschnitt 4.2) und die Berücksichtigung der Hintergrundinzidenz (vgl. Abschnitte 3.35 (3); 3.36) in der vorgegebenen Weise zu verstehen. Der POD dient als Startpunkt für eine Extrapolation oder zu Vergleichszwecken; somit ist die T25 je nach Vergleichsebene bereits als Humanäquivalent anzugeben (hT25) oder auf der Ebene des Tierexperiments zu nutzen. Die Randbedingungen der Anwendung einer T25 sind jeweils präzise auszuweisen.
(2) Bei hinreichender Qualität der Beobachtungsdaten ist der POD als „Benchmarkkonzentration“ bzw. Benchmarkdosis auszuweisen. Dabei ist der zentrale Schätzwert (BMD) und nicht der 95-Prozent-Vertrauensbereich (BMDL)8) heranzuziehen.9) Der POD dient als Startpunkt für eine Extrapolation oder zu Vergleichszwecken; somit ist die Benchmarkdosis je nach Vergleichsebene bereits als Humanäquivalent anzugeben (hBMD)10) oder auf der Ebene des Tierexperiments zu nutzen. Die Randbedingungen der Anwendung einer Benchmarkdosis sind jeweils präzise auszuweisen.
Die Kriterien für eine ausreichende Qualität der Daten zur Modellierung nach dem Benchmark-Verfahren sind gesondert festzulegen (vgl. Abschnitt 3.4). Der Faktor zwischen BMD und BMDL gibt auch eine Aussage zur Qualität der vorgenommenen Modellierung (Anpassungsgüte der Modellfunktion an die vorliegenden experimentellen Daten). Insofern kann bei Berechnung der BMDL dieser Faktor auch (neben anderen Kriterien) für die Beurteilung der Frage herangezogen werden, ob das Benchmark-Verfahren im konkreten Fall überhaupt zur Anwendung kommen sollte.
Die Auswahl des BMD statt des BMDL beinhaltet möglicherweise einen gewissen Fehler (da nicht ausgeschlossen werden kann, dass die Expositions-Risiko-Beziehung durch den BMDL korrekter beschrieben wird). Die Wahl des BMD erscheint jedoch begründet: 1) wegen der Analogie zur T25 bei schlechterer Datenlage (T25 ist ebenfalls ein zentraler Schätzwert ohne Vertrauensbereich), 2) wegen des – nach der Extrapolation in den interessierenden Konzentrationsbereich – nur geringen möglichen Fehlers (bei großer Abweichung zwischen BMD und BMDL würde dies gegen die Anwendung des Benchmarkverfahrens sprechen), 3) da durch die Linearisierung im Bereich unterhalb der BMD als POD in den meisten Fällen ohnehin ein konservatives Extrapolationsverfahren gewählt wird.
Zur Umrechnung einer Benchmarkdosis auf eine äquivalente Humanexposition vgl. Abschnitt 4.
(3) Die „Benchmark-Response“ (BMR11)) beim POD ist aus Gründen der Vergleichbarkeit in der Regel auf 10 % zu setzen. Abweichend kann (nur) dann eine BMD5 als POD herangezogen werden, wenn die BMD10 noch im beobachteten Bereich liegt. Eine BMD1 kann nur dann als POD herangezogen werden, wenn die BMD5 noch im beobachteten Bereich liegt.
In vielen Fällen gibt es keine starken Abweichungen im angenommenen Risiko, wenn der T25 mit der BMD10 unter Korrektur (lineare Umrechnung) des Risikoniveaus verglichen wird (vgl. Anhang zu EC, Technical Guidance Document, 2005). Je nach Verlauf der Konzentrations-Risikobeziehung sind jedoch Abweichungen möglich. Deshalb und wegen der kompletteren Beschreibung des abgeleiteten Verlaufs der Konzentrations-Risikobeziehung im experimentellen Bereich wird der Anwendung des Benchmark-Verfahrens der Vorzug gegeben. Zu Beispielen vgl. Abschnitt 5.2.
Eine Fortführung der Modellierung zwischen BMD10 und BMD0,1 (Response von 10 % oder 1 Promille) wird im vorliegenden Leitfaden für den Fall einer mechanistisch begründeten Nichtlinearität bei guter Datenlage eingesetzt (vgl. Abschnitt 5.2). Liegen keine hinreichenden Gründe für Nichtlinearität vor, so wird die Modellierung mit der Benchmarkmethode nur für den experimentellen Bereich bis zu einer BMD10 als POD vorgenommen. In der früheren Vorgehensweise der U.S.EPA wurde das linearisierte Multistage (LMS)-Modell herangezogen. Dieses Verfahren ist praktisch identisch mit einer Modellierung mit dem Multistage-Modell im experimentellen Bereich und der Fortführung der modellierten Funktion in den Niedrigrisikobereich (z. B. bei BMR 1:1.000). Beim EPA-Konzept wird jedoch der 95-Prozent Vertrauensbereich einbezogen.
(4) Ist die Ausweisung einer hinreichend qualifizierten Benchmarkkonzentration nicht möglich, ist die T25 in der Berechnung nach dem Verfahren von Sanner et al. (2001)/ Dybing et al. (1997) als POD heranzuziehen.
Die Berechnungsformel zur T25 findet sich im Glossar.
Der T25 wird gegenüber ähnlichen anderen Werten als POD der Vorzug gegeben, wenn das Benchmarkverfahren nicht eingesetzt werden kann, weil
  • dies dem Verfahren der Risikoquantifizierung in verschiedenen Festlegungen zum Risk Assessment der EU entspricht,
  • die in Deutschland früher diskutierte „Steinhoff“-Methode mit der T25 als POD kompatibel ist,
  • sie jedoch nicht auf einen normierten Prozentsatz (25 %) bezogen ist,
  • die LED(10) der U.S.EPA (2005a) wiederum die Anwendung des Benchmark-Verfahrens voraussetzt, was nicht immer hinreichend qualifiziert ist.
Das ED(10)-Verfahren der U.S.EPA basiert ebenfalls auf der Benchmark-Modellierung (ohne Berücksichtigung des Vertrauensbereichs) und ist methodisch identisch zur Ableitung der BMD10. Für die Berechnung eines Referenz-MoE nach EU/TGD wird in der Regel der Unterschied zwischen T25 und ED10 linear berücksichtigt, so dass in dem EU-MoE-Ansatz auch die ED10 als POD herangezogen werden kann.
(5) Für Extrapolationen in den regulatorisch interessierenden Bereich unterhalb der beobachteten Inzidenzen, bei denen die Fortsetzung der im Beobachtungsbereich bereits vorliegenden Konzentrations-Wirkungs-Beziehung (stetige Funktion; vgl. Abschnitt 5.2) angenommen wird, ist die Angabe eines POD formal nicht erforderlich. Dieser sollte aber dennoch zu Vergleichszwecken ausgewiesen werden.
(6) BMD10 bzw. T25 sind für alle humanrelevanten Tumorlokalisationen zu errechnen (zur Auswahl der Tumorlokalisationen und Spezies vgl. Abschnitt 3.1)
(7) Bei Benchmarkmodellierungen mit qualitativ schwachen Daten (vgl. Abschnitt 3.3) ist es sinnvoll, sowohl die Berechnung des T25 wie auch der BMD10 vorzunehmen, um die Auswirkungen der Unsicherheit der jeweiligen Entscheidung zu erkennen: ggf. liegen die nach den jeweiligen Verfahren ermittelten POD nahe beieinander oder zeigen deutliche Diskrepanzen. Die entsprechende Information ist zu dokumentieren.
Für Beispiele vgl. Abschnitt 5.2 (Fall B)
Fußnote 8)
Begrifflichkeit zum Benchmarkverfahren vgl. Glossar und EPA, 2000
Fußnote 9)
Im Folgenden wird übergreifend von BMD („Benchmarkdosis“) oder BMDL gesprochen, auch wenn es sich in diesem Falle um Luftkonzentrationen (BMC, BMCL) handelt
Fußnote 10)
Zur Bedeutung des Terminus Humanäquivalent und zur Umrechnung vgl. Abschnitt 4
Fußnote 11)
Abkürzungen beim Benchmarkverfahren: vgl. Glossar

3.3   Anwendung des Benchmarkverfahrens

(1) Die für die Kurvenanpassung auszuwählenden Modelle sollten den mechanistischen Vorstellungen zur Kanzerogenese nicht widersprechen. Deshalb wird oft das „Multistage-Model“ (oder -Funktion) herangezogen, das dem Mehrstufenmodell der Krebsentstehung entspricht. Die Gamma-Funktion passt jedoch ebenfalls zu diesem mechanistischen Verständnis. Multistage- oder Gamma-Funktion sind demnach bevorzugt zur Modellierung mit dem Benchmarkverfahren im experimentellen Bereich heranzuziehen. Andere Modelle sollten jedoch nicht ausgeschlossen werden, wenn sie eine deutlich bessere Anpassung an die Daten ermöglichen. Das „quantal lineare“ Modell der BMDS sollte jedoch bei quantalen Daten (bei Fallzahlen zur Kanzerogenität zutreffend) nach einer Empfehlung der EFSA nicht gewählt werden12).
Es stehen unterschiedliche Software-Produkte für Modellierungen der Benchmark zur Verfügung. Insbesondere ist die BMDS der U.S.EPA13) zu nennen. Stattdessen ist auch die Verwendung von PROAST des Niederländischen „National Institute for Public Health and the Environment“14) möglich. Die Abschneidekriterien und Anwendungsregeln werden im Folgenden jedoch nur auf BMDS bezogen. Sollte PROAST für die Modellierung herangezogen werden, sind die hierbei herangezogenen Parameter und Abschneidekriterien zu dokumentieren.
Bei der BMDS liegt ein entscheidendes Kriterium bei der Auswahl des besten Modells in dem niedrigsten AIC-Wert (AIC: Akaike's Information Criterion für die Bewertung der Regressionsanpassung).
Bei erheblichen Diskrepanzen zwischen zulässigen Ergebnissen ist ein Durchschnitt dieser Werte (BMD bzw. BMDL) zu bilden (insbesondere bei PROAST relevant). Diese Durchschnittsbildung erfolgt zunächst ungewichtet, bis zusätzliche Maßstäbe für eine Gewichtung etabliert sind (Davis et al., 2011; EFSA, 2009).
(2) Wird das Benchmarkverfahren für die Quantifizierung von Effektschwellen bei nichtkanzerogenen Effekten genutzt, ist in der Regel die BMDL15) statt der BMD für die Bewertung heranzuziehen. Die Entscheidung bei der Modellauswahl verläuft analog dem Vorgehen bei kanzerogenen Effekten (vgl. (1)).
Fußnote 15)
Abkürzungen beim Benchmarkverfahren: vgl. Glossar

3.4   Mindestanforderungen an die Datenqualität für Anwendung des Benchmarkverfahrens

(1) Zur Durchführung des Benchmarkverfahrens sollten in der Regel mindestens die Daten zur Kontrollgruppe und zwei Dosisgruppen vorliegen.
In Annex XI zum TGD der EU wird anhand einiger Beispiele eine Abwägung zwischen T25 und BMD05 vorgenommen. Dabei wurden drei Dosisgruppen gefordert. Dieses Kriterium ist jedoch nicht erforderlich, da eine unzureichende Datenlage über andere Kriterien ausreichend erfasst ist. Eine schlechte Modellierung mit zulässigen Modellen führt aufgrund der zu erwartenden ungenügenden Qualität der statistischen Auswertung indirekt zur Entscheidung gegen das Benchmarkverfahren.
(2) Unterscheidet sich die Tumorhäufigkeit in allen Dosisgruppen nicht oder nur unwesentlich (Plateaueffekt), ist die Anwendung des Benchmarkverfahrens nicht sinnvoll.
Auch der Plateaueffekt wird üblicherweise durch den schlechten Modellfit bereits berücksichtigt und ist daher kein notwendigerweise explizites Kriterium, ist jedoch eine hilfreiche Information, da so auf Basis der optischen Bewertung bereits ein Ausschluss erfolgen kann.
(3) Gibt es nur eine Dosisgruppe außer der Kontrolle, bei der die Effektstärke deutlich über dem BMR liegt, ist das Benchmarkverfahren nicht sinnvoll anwendbar.
In diesem Fall liegen nur zwei Punkte vor, so dass eine lineare Verknüpfung erfolgt (T25-Verfahren). Liegt die Dosisgruppe nahe beim gesuchten BMR und ist das Ergebnis signifikant, kann der entsprechende Punkt statt des T25-response direkt als POD herangezogen werden. Dies schließt nicht aus, dass für die Extrapolation – ausgehend von diesem POD – schließlich bei qualifizierten Hinweisen auf eine Sublinearität eine Knickfunktion herangezogen wird (vgl. Abschnitt 5.2).
(4) Solche Benchmarkmodelle sind zu verwerfen, die einen zu kleinen p-Wert (p < 0,05) erbringen. Ebenfalls sind Modelle zu verwerfen, bei denen BMD/BMDL > 10 ist (hohe Unsicherheit der BMD). Modelle deren „scaled residuals“ im Bereich der BMR außerhalb –2 bis +2 liegen, sind ungeeignet. Verbleiben mehrere zulässige Benchmarkkalkulationen, so sind diese nur geeignet, wenn die Spanne der ausgewählten BMDL ≤ 10 ist (ähnlich qualifizierte Modelle ergeben große Spanne möglicher Antworten und erlauben deshalb keine eindeutige Aussage).
Dieses letztere Kriterium ist nicht statistisch begründet entspricht aber dem Vorgehen der EFSA.
Bei der Benchmarkmodellierung nach BMDS erfolgt ein „Goodness of fit“-Test. Dabei werden die „log-likelihood-Werte“ verglichen:
A) von „reduced“ vs. „full model“. Dieser Test prüft, ob überhaupt eine Dosis-Wirkungsbeziehung vorliegt. Ein p-Wert von ≤ 0,05 gilt als Akzeptanzkriterium.
B) von „fitted model“ vs. „full model“. Dieser Test prüft, ob das Modell den Kurvenverlauf hinreichend gut schätzt. Ein p-Wert von > 0,05 wird entsprechend dem Vorgehen der EFSA als Akzeptanzkriterium für das „fitted model“ gesetzt.
(5) Unter den nach Prüfung der Auswahlkriterien gemäß (4) verbleibenden geeigneten Benchmarkmodellierungen wird abgewogen: bei Verwendung von BMDS wird das Modell mit der minimalen BMDL demjenigen mit dem niedrigsten AIC-Wert gegenübergestellt, zusätzlich geprüft, ob ein Multi-stage- oder Gamma-Modell eine geeignete Modellierung ergibt und zugleich geprüft, ob die optische Anpassung zu einem plausiblen Ergebnis führt; es erfolgt dann eine Abwägung und Begründung der Auswahl.
Die Protokolle der BMDS-Berechnung sind, wenn Unsicherheiten in der Auswahl bestehen, detailliert zu prüfen, ob durch die Parameterfixierung künstliche Einschränkungen eingetreten sind (z. B. keine ausgewiesenen p-Werte), die die Bewertung des Ergebnissen erschweren.
(6) In Zweifelsfällen mit begrenzter Datenqualität ist nach Abschnitt 3.2 (7) vorzugehen. D. h., es ist zwischen T25 und dem Benchmarkverfahren abzuwägen. Die Begründung für die letztlich gewählte Verfahrensweise ist zu dokumentieren.
Für ein Beispiel vgl. Abschnitt 5.2 (Fall B)
(7) Für die Modellierung dürfen nur dann Dosierungen weggelassen werden, wenn mehrere Dosierungen einen Plateaueffekt charakterisieren oder im Hochdosisbereich sogar abfallende Inzidenzen beobachtet werden oder der Verlauf durch eine nahezu 100 %ige Inzidenz begründet ist.
Ein Plateaueffekt, spezifische Veränderungen bei Dosierungen nahe der maximal tolerierbaren Dosis oder eine ca. 100 %ige Inzidenz lassen keine Differenzierung mehr zu, so dass diese Information auch die Expositions-Risiko-Beziehung verzerren kann. In diesem Fall kann die Information zu dieser Gruppe (Hochdosisbereich) vernachlässigt werden. Das Weglassen von Dosisgruppen führt jedoch zu einer Verminderung der Freiheitsgrade bei der Modellierung.
(8) Es werden keine BMD-Kalkulationen weiter genutzt, in denen der p-Wert nicht quantifiziert wurde.
Ein nicht quantifizierter p-Wert ist durch einen Hinweis im Protokoll bei BMDS erkenntlich: „p = not applicable“

3.5   Vorgehen im Falle von Humandaten

Die Einordnung der Rolle epidemiologischer Beobachtungsstudien im Vergleich zum Tierexperiment bei der Quantifizierung von Krebsrisiken am Arbeitsplatz erfolgte bereits in Abschnitt 1.1 und bei der Erläuterung der zu Grunde zu legenden Datenbasis (Abschnitt 1.5 (1)). Zum hier verwendeten Risikobegriff wird auf Abschnitt 1.4 verwiesen.
Die folgenden Hinweise zum Vorgehen setzen eine adäquate epidemiologische Datenlage voraus (für Mindestkriterien vgl. Abschnitt 8.6 dieses Leitfadens).
(1) Bei der Auswahl epidemiologischer Studien ist wie folgt vorzugehen:
  • Die vorhandene epidemiologische Evidenz sollte mittels einer strukturierten, systematischen Literatursuche identifiziert und auf ihre Qualität und Eignung für die Risikobewertung geprüft werden. Prinzipien, die für die Auswahl von arbeitsepidemiologischen Studien zur Durchführung einer Meta-Analyse aufgestellt wurden, sollten hier berücksichtigt werden. Es ist im Einzelfall zu entscheiden, ob mehrere Studien für die Bewertung in einer Meta-Analyse zu einem gepoolten Schätzer zusammengefasst werden können oder ob einzelne Studien separat bewertet werden, um eine Spanne für mögliche Risikoszenarien angeben zu können.
    Literatur: Blair et al. (1995); Roller et al. (2006), Kap. 5.2; vgl. auch die Diskussion zur Metaanalyse bei granulären biopersistenten Stäuben (Gebel, 2012; 2013; Morfeld, 2013).
  • Generell sind analytische Studiendesigns mit individueller Expositionseinschätzung zur Risikobewertung auszuwählen. Sowohl Kohorten- als auch Fall-Kontroll-Studien können dabei zur Risikobewertung herangezogen werden.
    Die in der Arbeitsepidemiologie verwendeten beobachtenden Studiendesigns lassen sich nach absteigendem Evidenzgrad wie folgt ordnen: (1) Kohortenstudie (KS); (2) Fall-Kontroll-Studie (FKS); (3) Querschnittstudie (QS); (4) Ökologische oder Korrelationsstudie.
    Quantitative Expositionsdaten stehen häufiger aus KS zur Verfügung, während FKS in der Regel eine bessere Berücksichtigung von Störeinflüssen („con-founding factors“) gewährleisten (weitere Details zu den besonderen Stärken und Schwächen der Studiendesigns siehe Ahrens et al., 2008). In begründeten Ausnahmefällen, z. B. einer in eine Kohorte eingebetteten FKS mit spezifischeren oder genaueren Informationen zu Exposition und/oder Wirkungsendpunkt, kann eine FKS besser für eine Risikoabschätzung geeignet sein als die zugrunde liegende KS.
(2) Zielparameter werden wie folgt berücksichtigt:
  • Generell sind Maße mit Bezug zur Krebsinzidenz denen zur Krebsmortalität vorzuziehen, es sei denn, Inzidenz und Mortalität können aufgrund einer hohen Letalität der Erkrankung (wie z. B. beim Lungenkarzinom) als nahezu identisch angesehen werden.
  • Je feiner die betrachteten Wirkungsendpunkte aufgegliedert werden, umso geringer ist die zahlenmäßige Besetzung der Strata. Es ist also im Einzelfall abzuwägen, ob sich verschiedene Wirkungsendpunkte sinnvoll zusammenfassen lassen, um die statistische Power zu erhöhen (d. h. Zusammenfassung verschiedener verwandter Tumorentitäten zu einer Gruppe), auch wenn sich kausale Faktoren im Einzelnen unterscheiden können, z. B. bei Kopf-Hals-Tumoren oder myeloproliferativen Erkrankungen.
  • Es ist im Einzelfall zu entscheiden, ob „vorgezogene“ Wirkungsendpunkte (z. B. biologische Marker), die als notwendige Frühstadien der Kausalkette zur untersuchten Zielerkrankung zugerechnet werden können, in die Bewertung der Studienlage einbezogen werden können. Dies ist besonders dann sinnvoll, wenn derartige frühe klinische Effekte als Warnsignale anzusehen sind.
    Die Berücksichtigung bei der Bewertung erfolgt in der Regel subsidiär, d. h. zur Stützung bei der Auswahl eines POD bei „weight of evidence“-Bewertungen oder bei der Selektion einer Extrapolationsmethode. Warnsignale können die Einführung von Schutzmaßnahmen rechtfertigen.
(3) Bei der Berechnung der Akzeptanz- und Toleranzkonzentrationen kann folgendermaßen vorgegangen werden:
  • Generell wird für die Berechnung der risikobezogenen Konzentrationen ein kumulatives Expositionsmaß verwendet (40 Jahre Arbeitsleben mit durchschnittlicher Exposition). Nur wenn es durch das Wirkprinzip zu begründen ist, kann auf andere Expositionsmaße ausgewichen werden.
  • Ein Punktschätzer für jede Expositionskategorie (z. B. Median, geometrisches Mittel) ist die bevorzugt zu verwendende Angabe.
    Ist lediglich ein Expositionsbereich berichtet worden (z. B. 1-9 ppm-Jahre), so kann für die Berechnung die Bereichsmitte (im Beispiel 5 ppm-Jahre) zugrunde gelegt werden. Konzentrationsangaben in mg/m3 sollten stoffspezifisch auch in ppm umgerechnet werden. Für die Berechnungen der Akzeptanz- und Toleranzkonzentrationen werden 240 Arbeitstage/Jahr und ein Atemvolumen von 10 m3 pro Arbeitstag herangezogen, für den 8 h angenommen werden (das Atemvolumen ist abhängig von der Arbeitsbelastung, 10 m3 betrifft eine leichte bis moderate Anstrengung).
    (vgl. Abschnitt 4.6 und van Wijngaarden und Hertz-Picciotto (2004)).
  • Die kumulierten Konzentrationsangaben in ppm-Jahren sind danach auf den Langzeit-Mittelwert über 40 Jahre umzurechnen.
  • Je nach Datenlage sind unmittelbar absolute Risikomaße (z. B. kumulatives Risiko) oder – wenn diese nicht berichtet wurden – Maße des relativen Risikos zur Exposition in Beziehung zu setzen. In der Regel werden Maße wie SMR, SIR, RR oder OR vorliegen. Zur Berechnung des Lebenszeitrisikos der Exponierten können diese relativen Risikoerhöhungen mit einem Schätzwert für das Lebenszeitrisiko der Vergleichsgruppe, z. B. der Allgemeinbevölkerung, multipliziert werden, sofern nicht die ausführliche Sterbetafelmethode angewendet wird.
    Eine geeignete Quelle zur einheitlichen Auswahl des Hintergrundrisikos beim Bezugskollektiv ist z. B. RKI (2011).
  • Das für die Expositionsspannweite berichtete Risikomaß (RR/SIR etc.) kann mit dem kumulierten Expositionswert in einer Regressionsanalyse korreliert werden, was eine Extrapolation in den Hoch- bzw. Niedrigrisikobereich und Aussagen zum Risiko pro Unit-Anstieg (1 ppm) der Exposition ermöglicht. Somit kann das Lebenszeitrisiko in Abhängigkeit von einer gegebenen Expositionshöhe bzw. einem angenommenen Arbeitsplatzgrenzwert geschätzt werden.
  • Nach Subtraktion des Risikos der Nicht-Exponierten (z. B. Allgemeinbevölkerung) wird ein Schätzwert des expositionsbezogenen Exzess-Risikos erhalten.
  • Einschränkungen der Aussagekraft der Ergebnisse sind zu diskutieren
    Es wird somit ein Vorgehen analog zu Roller et al. (2006) und Goldbohm et al. (2006) vorgeschlagen.
    Einschränkungen der Aussagekraft der Ergebnisse sind z. B. Bias, mögliches residuelles „Confounding“, Missklassifikation usw. Die Verwendung von Risikoschätzern, die für „Confounder“-Effekte adjustiert wurden, ist anzustreben. Wegen der Modellabhängigkeit der Adjustierung und zur Abschätzung der Stärke eines möglichen „Confounding“, sollten möglichst Berechnungen adjustierter den nicht adjustierten Risiken einander gegenübergestellt werden.
    Inkonsistente oder nicht vorhandene Dosis-Effekt-Beziehungen können in epidemiologischen Studien häufig beobachtet werden. Aber auch in den Fällen, in denen Studienergebnisse lediglich das Vorhandensein eines Ursache-Effekt-Zusammenhangs andeuten, können die Daten berücksichtigt werden. Abweichungen von einer erwarteten Dosis-Effekt-Beziehung und ihre möglichen Ursachen und Konsequenzen für die Risikoextrapolation sind zu diskutieren.
    Es ist zu bedenken, dass das vorgestellte Vorgehen Variationen des Risikos zwischen Individuen aufgrund unterschiedlicher Suszeptibilität ignoriert. Auch ist zu vermuten, dass sich die Zusammensetzung der untersuchten Kohorten hinsichtlich ihrer Morbidität und begleitender Expositionen von der Allgemeinbevölkerung unterscheidet (Healthy Worker Effect), so dass die Ergebnisse nicht repräsentativ für andere Bevölkerungen sein müssen. Vor dem Hintergrund einer Bewertung des Risikos von Arbeitsstoffen und der Festlegung von Grenzwerten zur Verbesserung des Arbeitsschutzes sind diese Überlegungen jedoch von untergeordneter Bedeutung.
    Bei semiquantitativen Expositionsangaben und sonst fehlenden epidemiologischen Daten kann versucht werden, ggf. durch Rückfrage bei den Autoren der Originalpublikationen Einstufungskriterien für Expositionsstufen zu ermitteln und damit eine quantitative Expositionsbewertung vornehmen zu können.
(4) Anpassung der Atemrate und des Atemvolumens/Tag von Umwelt auf Arbeitsplatz: Wird von einer Studie mit Umweltexposition des Menschen ausgegangen (mit 20 m3 Atemvolumen/Tag), muss eine Umrechnung auf 8 h Expositionsdauer pro Tag am Arbeitsplatz vorgenommen werden. Für diesen verkürzten Zeitraum wird dann ein Atemvolumen von 10 m3 unterstellt (Umrechnung über Faktor 2).
(→Verweis auf identisches Atemvolumen/d bei Umrechnung aus Tierversuch vgl. Abschnitt 4.2)
(5) Abweichungen vom Default sind in folgenden Fällen möglich:
  • Um die Konsistenz der Ergebnisse unter verschiedenen Voraussetzungen prüfen zu können, können von der kumulativen Exposition abweichende Expositionsmaße (Intensität, Dauer, Expositionsspitzen, Wirkschwelle) je nach Wirkprinzip ebenfalls Berücksichtigung finden, falls entsprechende Schätzer in den bewerteten Artikeln dokumentiert wurden.
  • Querschnittstudien und ökologische Studien sollten in aller Regel bestenfalls als Ergänzung zu qualifizierteren epidemiologischen Daten und/oder zu tierexperimentellen Daten herangezogen werden („weight of evidence“-Betrachtung) und erlauben als eigenständige Basis in der Regel keine hinreichend qualifizierte Risikoquantifizierung.
(6) Für die Extrapolation in den Niedrigrisikobereich wird auf das Vorgehen bei tierexperimentell-toxikologischen Daten verwiesen (vgl. Abschnitt 5). Humandaten sollten nach Möglichkeit zur Überprüfung der Plausibilität der Extrapolationsfaktoren bei der Übertragung von Tierexperimenten auf den Menschen herangezogen werden.

3.6   Umgang mit der Hintergrundinzidenz

(1) Entsprechend dem Standardvorgehen beim T25- und beim Benchmark-Verfahren (nach der Software der U.S.EPA oder der PROAST-Software) ist in der Regel die „extra risk“-Kalkulation heranzuziehen.
Die Konvention, das „extra risk“ zu wählen, ist aus toxikologischer Sicht nicht gut begründet, wird jedoch als Standardvorgehen akzeptiert, da (i) in der Regel die Abweichungen bei niedriger Hintergrundrate gering ausfallen, (ii) eine Übereinstimmung mit vielen älteren Unit-Risk-Berechnungen besteht, (iii) so eine Übereinstimmung mit dem T25-Verfahren und (iv) ebenfalls mit der traditionellen Vorgehensweise beim Multistage-Verfahren gewährleistet ist.

3.7   Risikoquantifizierung durch Ausweisung der T25

(1) Die Festlegung eines POD durch die Ausweisung des T25-Wertes nach dem Verfahren von Sanner et al. (2001) und Dybing et al. (1997) erfordert keine Modellierung der Dosis-Wirkungs-Beziehung im experimentellen Bereich. DieT25 wird durch lineare Interpolation bestimmt. Dieses Verfahren ist regelmäßig heranzuziehen, wenn eine qualifizierte Benchmarkberechnung nicht möglich ist.
Zur näheren Definition der T25 vgl. Glossar.
(2) Wenn ausschließlich der Inhalationspfad relevant ist (für Arbeitsplatzgrenzwerte der Fall), wird der T25-Wert als Luftkonzentration (mg/m3 bzw. ppm) ausgedrückt.
Zur weiteren Normierung der T25 auf das Expositionsmuster am Arbeitsplatz vgl. Abschnitt 4.2.
(3) Details zur Vorgehensweise bei diesem T25-Verfahren sind der zitierten Literatur (ECHA, 2012b) zu entnehmen. Die wichtigsten Punkte sind:
  • Als Ausgangspunkt wird die niedrigste Dosisgruppe gewählt, die eine signifikant erhöhte Tumorinzidenz aufweist
    Das Kriterium der Signifikanz ist entweder auf statistischer („Fisher Exact Test“ zum Vergleich der Dosis- mit der Kontrollgruppe) oder auf biologischer Basis festzulegen. Analog FDA (2001) wird die Verwendung eines Signifikanzniveaus von p < 0,05 für seltene Tumore bzw. Tumore mit einer Spontaninzidenz als 10 % oder p < 0,01 für Tumore mit höherer Spontaninzidenz als 10 % vorgesehen. Ggf. sind neben der experimentellen Kontrollgruppe auch die Daten der historischen Kontrolle vergleichend heranzuziehen (vgl. zu historischen Kontrollinzidenzen z. B. Derelanko and Hollinger (2002)).
  • Von der Tumorinzidenz in der behandelten Gruppe wird die Spontaninzidenz in der Kontrollgruppe abgezogen
    Eine Korrektur für aufgetretene Mortalität wird im Allgemeinen nicht vorgenommen, so dass bei hoher Mortalität in der betrachteten Dosisgruppe die damit verbundene erhöhte Unsicherheit des T25-Wertes zu diskutieren oder die nächst niedrigere Dosisgruppe zu wählen ist. Hohe Mortalität kann auch bedeuten, dass die Studie nicht mehr für eine Risikoquantifizierung herangezogen werden kann (vgl. Abschnitt 8, Minimalkriterien)
  • T25-Werte werden in der Regel getrennt für Spezies, Geschlecht und Organ/Tumortyp berechnet (vgl. Abschnitt 3.1 (6)).
    Eine Zusammenfassung von Tumortypen/Organen/Geschlechtern kann mit Begründung erfolgen (vgl. Abschnitt 3.1 (6)).
  • Eine gegenüber der Standard-Lebensspanne der Versuchsspezies verkürzte Expositionsdauer und verkürzte Beobachtungszeit wird korrigiert.
    Die gegenüber der Standard-Lebensspanne (w in Wochen) der Versuchsspezies verkürzte Expositionsdauer (w1 in Wochen) und verkürzte Beobachtungszeit (w2 in Wochen) wird durch Multiplikation mit dem Faktor (w1/w) x (w2/w) korrigiert (vgl. Abschnitt 4.5);
  • Gegenüber den gewählten Standardwerten abweichende Expositionsschemata werden berücksichtigt.
    Dies erfolgt durch lineare Umrechnung etwa bei Dosierungen/Tag, Expositionstage/Woche, sowie Expositionsdauer/Tag bei Inhalation
  • Für die Risikoquantifizierung wird der niedrigste, als humanrelevant (in Bezug auf Spezies/Organ/Tumortyp) erachtete T25-Wert verwendet (vgl. auch Abschnitt 3.1).
    Diese Ausführungen sind nicht in voller Übereinstimmung mit der üblichen Vorgehensweise nach EU: Der T25-Wert wurde ursprünglich als körpergewichtsbezogene Stoffdosis konzipiert und somit in mg pro kg Körpergewicht und Tag (mg/kg x d) angegeben. Liegen mehrere Studien vor, die nicht alle Schlundsonden benutzten, sondern Tiere z. B. über Trinkwasser, Futter oder Atemluft exponierten, wird die Umrechnung der Exposition auf die körpergewichtsbezogene Dosis als gemeinsame Vergleichsbasis vorgeschlagen (EC, 1999). Im vorliegenden Fall ist jedoch die Ausweisung einer Konzentrationsangabe, z. B. in mg/m3, erforderlich.
    Wenn keine Pfad-zu-Pfad-Übertragung zulässig ist (vgl. Abschnitt 4.4), dann kann der entsprechende (orale oder dermale) Ausgangswert für eine inhalative T25 nicht verwendet werden.
(4) Die T25 wird mit den Faktoren, wie in Abschnitt 4 spezifiziert, in ein Humanäquivalent umgerechnet (hT25).

4   Übertragung tierexperimenteller Daten auf den Menschen

4.1   Berücksichtigung von Speziesdifferenzen

(1) Für das Auftreten kanzerogener Wirkung wird bei der Ableitung von Risikokonzentrationen nach diesem Leitfaden in der Regel von gleicher Empfindlichkeit des Versuchstiers mit dem Menschen bei inhalativer Exposition ausgegangen. Diese Annahme ist nicht gut abgesichert; sie hat demnach bei nur beschränkter wissenschaftlicher Validierung Konventionscharakter.
Roller et al. (2006) zeigten für eine Reihe von Kanzerogenen bei Inhalationsstudien eine eher höhere Empfindlichkeit des Menschen im Vergleich zum Versuchstier. Die Autoren kamen damit zur Schlussfolgerung: „Die Ergebnisse deuten darauf hin, dass eine Speziesextrapolation anhand der äquivalenten Exposition ohne besondere Berücksichtigung toxikokinetischer und toxikodynamischer Speziesunterschiede in der Regel nicht zu einer Überschätzung des Risikos des Menschen führt.“ Mit diesem Befund lässt sich die Aussage in Abschnitt 4.1 (1) stützen. Roller et al. (2006) gehen jedoch weiter und schlagen auf Basis ihrer Befunde vor, auch dann gleiche Empfindlichkeit anzunehmen, „wenn sich – zum Beispiel aufgrund mechanistischer Daten – eine geringere Empfindlichkeit des Menschen vermuten lässt.“
(2) Stoffspezifische Angaben, die ein deutliches Abweichen vom Durchschnitt zeigen (z. B. aus pharmakokinetischen Modellen) können für die Risikoquantifizierung Abweichungen vom Default begründen.
Dieses Vorgehen ermöglicht bei „deutlichem Abweichen vom Durchschnitt“ ein Abweichen vom Default. Welches Gewicht der mechanistischen oder kinetischen Erkenntnisse eine geringere Empfindlichkeit des Menschen mit hinreichender Wahrscheinlichkeit vermuten lässt, ist eine Einzelfallabwägung („expert judgement“).

4.2   Vorgehen bei Vorliegen einer tierexperimentellen Inhalationsstudie

(1) Tierexperimentell in einer Inhalationsstudie getestete Substanzen werden dort in der Regel über 6 h/Tag exponiert. Unter Berücksichtigung der erhöhten körperlichen Aktivität des Menschen (Annahme Atemvolumen 10 m3 über 8 h Arbeitszeit/Tag) ist in der Regel ein Umrechnungsfaktor von Zwei (Ratte → Mensch; Maus → Mensch) zu wählen, um die humanäquivalente Expositionshöhe zu berechnen. Dieser Faktor gilt für systemische Effekte.
Mit dieser Annahme wurde einer Konvention entsprochen, wie sie im entsprechenden REACH-Guidance-Dokument gewählt wurde. Das Vorgehen weicht (Stand: 2012) von der Methodik nach BekGS 901 ab (AGS, 2010).
Für systemische Effekte wird angenommen (REACH-Guidance-Dokument R.8), dass auch das Atemminutenvolumen im Verhältnis zum Körpergewicht mit den Scalingfaktoren zwischen den Spezies übertragen werden kann (Mensch: 0,2 l/kg Körpergewicht x min. in Ruhe; Ratte: Atemminutenvolumen 0,2 l/min, 250 g, folglich: 0,8 l/kg x min. Bei Scalingfaktor 4: 0,2 l/kg x min: identisch zu Mensch in Ruhe; Maus: Atemminutenvolumen 0,042 l/min, 30 g, folglich: 1,4 l/kg x min. Bei Scalingfaktor 7: 0,2 l/kg x min.: identisch zu Mensch in Ruhe).
Differenzierungen nach Wasserlöslichkeit (> 1 g/l, gut wasserlösliche Substanzen) erfolgen hierbei nicht (in Abweichung von der älteren Fassung dieses Leitfadens).
Danach entspricht z. B. eine T25 (Ratte) bei 6 h Exposition/d von 10 mg/m3 einer hT25 (Mensch, 8 h/Tag) von 5 mg/m3. Diese Anpassung erfolgt auch bei anderen Versuchstierspezies.
Das Vorgehen nach Abschnitt 4.2 (1) stellt eine vorläufige Festlegung dar (Stand Oktober, 2013). Ergänzende Überprüfungen wurden veranlasst und können ggfls. nach deren Abschluss zu späterem Zeitpunkt (mit zitierfähiger Begründung) für eine abweichende Extrapolation herangezogen werden.
(2) Der Faktor von Zwei ist auch zu nutzen, um Interspezies-Unterschiede im pulmonalen oder alveolären Atemminutenvolumen bei lokalen Effekten (im oberen oder unteren Respirationstrakt) bei 6 h/Tag aus dem Tierexperiment und 8 h/Tag beim Menschen mit erhöhter körperlicher Aktivität zu berücksichtigen und wenn keine formale HEC-Berechnung erfolgt. Bei der HEC-Berechnung werden diese Speziesdifferenzen bereits hinreichend berücksichtigt (vgl. Abschnitt 4.3).
Mit dieser Annahme wird eine Konvention aus dem entsprechenden REACH-Guidance-Dokument übernommen. Das Vorgehen weicht (Stand: 2012) von der Methodik nach BekGS 901 ab (AGS, 2010).
Abbildung 1:
Umrechnung von 6 h auf 8 Stunden Expositionsdauer und von Atemvolumen bei Ruhe (6,7 m3/8 h) auf erhöhte Aktivität 10 m3/8 h) nach ECHA, (2012b), figure R 8-2
Abbildung 1:Umrechnung von 6 h auf 8 Stunden Expositionsdauer und von Atemvolumen bei Ruhe (6,7 m/8 h) auf erhöhte Aktivität 10 m/8 h) nach ECHA, (2012b), figure R 8-2
Das Vorgehen nach Abschnitt 4.2 (2) stellt eine vorläufige Festlegung dar (Stand Oktober, 2013). Ergänzende Überprüfungen wurden veranlasst und können ggfls. nach deren Abschluss zu späterem Zeitpunkt (mit zitierfähiger Begründung) für eine abweichende Extrapolation herangezogen werden.
(3) Im Falle von Speziesunterschieden in der Resorption sind diese bei der Interspeziesextrapolation für die Quantifizierung der Dosis bei systemischen Effekten zu berücksichtigen.

4.3   Interspeziesextrapolation bei lokal wirkenden Partikeln und Aerosolen

(1) Bei Partikeln oder Aerosolen wird die abgeschätzte humanäquivalente Konzentration („human equivalent concentration“, HEC) auf Basis der Daten des Tierexperiments (Rattenexperiment) berechnet. Der Kehrwert des Faktors HEC/CT entspricht dem Interspezies-Extrapolationsfaktor und CT ist die Expositionskonzentration im Tierexperiment, für die eine entsprechende Transformation gewünscht wird. Allgemein wird HEC/CT über die Formel berechnet:
HEC/CT = (AgVT/AgVH) x (ELRH/ELRT) x (NFH/NFT) x (DFT/DFH) (1)
CT
Expositionskonzentration; Angabe als Massenkonzentration [mg/m3]
AgV
gewichtetes tägliches Atemvolumen
ELR
durchschnittliche Eliminationsrate (abhängig von der Clearancerate)
NF
Normalisierungsfaktor (Bezugsgewebe)
DF
Depositionsfraktion (Prozent/100)
T
Tier (Ratte)
H
Mensch
Eine ausführliche Beschreibung des HEC-Modells sowie über die Kriterien zur Auswahl der Rahmenbedingungen bei der Verwendung des HEC-Modells und bei der Berechnung der deponierten Dosis mit Hilfe der MPPD-Software sind in dem „Gutachten zur biologischen Plausibilität von HEC und MPPD“, Juli 201116) zu finden (FoBiG, 2011).
  • AgVT/AgVH
    Das Verhältnis AgVT/AgVH erhält im Standardfall den Wert von 0,008. Die Berücksichtigung der unterschiedlichen Expositionsdauer/Tag nach Abschnitt 4.2 entfällt, da im Faktor AgVT/AgVH bereits die unterschiedlichen Atemminutenvolumina und die unterschiedlichen Expositionszeiten (8 h beim Menschen; 6 h bei der Ratte im Standardfall) berücksichtigt sind.
    Für die Berechnung wurde eine Expositionsdauer von 6 h/d (Ratte) bzw. 8 h/d (Mensch) und ein Atemvolumen von 0,077 m3/d (Ratte) bzw. 10 m3/d (Mensch) zugrunde gelegt. Bei der Ratte wurde der gemittelte Wert über den Faktor 5/7 (Wochenexpositionstage) korrigiert, beim Menschen über den Wert 240/365 d/Jahr (Hartwig, 2012). Es ergeben sich AgVH = 6,57 m3/d und AgVT = 0,055 m3/d. Es folgt AgVT/AgVH = 0,00837 (gerundet auf 0,008). Sofern qualifizierte Daten zu den Ratten im Tierexperiment der Schlüsselstudie vorliegen, können hier die studienspezifischen Angaben eingesetzt werden.
  • NFH/NFT
    Das Verhältnis der Normalisierungsfaktoren wird im Standardfall mit NFH/NFT = 150 festgelegt. Damit erfolgt eine Normalisierung der deponierten Dosis auf die Oberfläche des Respirationstrakts (Alveolar- plus Tracheobronchialbereich), falls nicht im Einzelfall bessere Normalisierungsmaße begründet herangezogen werden können.
    Für die Berechnung wurden für die Lunge der Ratte Oberflächenmaße von 4090 cm2 (Alveolarbereich) und 35 cm2 (Tracheobronchialbereich) und für die Lunge des Menschen 627000 cm2 (Alveolarbereich) bzw. 3200 cm2 (Tracheobronchialbereich) herangezogen (Oberdörster, 2010) und der resultierende Wert gerundet. Wegen der ungenauen Zuordnung der Wirkung zu (nur) Alveolarbereich oder (nur) Tracheobronchialbereich erscheint die (quantitativ wenig relevante) Gesamtfläche als ein gutes Maß für die Charakterisierung der Speziesverhältnisse. Dies bedeutet nicht, dass nicht durch andere Kriterien (z. B. regionale Oberflächen von Teilbereichen der Lunge, Makrophagenanzahl, Makrophagenvolumen, oder Lungengewicht) im Einzelfall bessere Normalisierungsmaße dargestellt werden können. Diese führen jedoch meist zu einer Interspeziesdifferenz in ähnlicher Größenordnung. Differenzierungen nach Rattenstämmen sind in der Regel im Rahmen der Gesamtgenauigkeit nicht erforderlich.
  • DFT/DFH
    Das Verhältnis der Depositionsfraktionen (DFT/DFH) sollte jeweils mittels einer Modellierung mit dem „Multiple-Path Particle Dosimetry Model“ (MPPD-Modell, hier: Stand: 2011, Version 2.11) berechnet werden. Die Ergebnisse werden wesentlich von der Partikelgrößenverteilung bestimmt.
    Für die Wahl der Einstellungen im Programm des MPPD-Modells 2.11 ist im Anhang 10.3 eine erläuternde Tabelle beigefügt. Es sollten die dort empfohlenen Standardeinstellungen zur Ratte und beim Menschen übernommen werden. Beim Menschen werden für Expositionsbedingungen Daten empfohlen, die der Charakterisierung „leichte Aktivität“ sowie gemischte Mund- und Nasenatmung entsprechen.
    Hintergrundinformationen für die gewählte Vorgehensweise findet sich auch in der Hilfefunktion der frei verfügbaren Modellierungssoftware (MPPD, 2011).
    In der Regel sollte nicht von den in der Tabelle empfohlenen Standardeinstellungen abgewichen werden, da
    • die Modellvalidierung bei einigen Änderungen nicht abgesichert ist,
    • für die ERB-Berechnungen nur eine grobe Orientierung an der Vielzahl differenzierter Übertragungsmöglichkeiten gerechtfertigt ist,
    • z. B. andere Dosismaße bei mehreren parallel wirkenden Mechanismen nicht eindeutig allein eine verbesserte Berechnung der Depositionsfraktion ergeben und
    • andere Dosismaße (z. B. Partikelanzahl) nicht notwendigerweise zu anderen und besser abgesicherten Interspeziesextrapolationen führen.
    Die deponierten Fraktionen im gesamten Tracheobronchial- und Alveolar-Bereich können aus dem Protokoll der Berechnung (MPPD) abgelesen und ins Verhältnis gesetzt werden (DFT/DFH).
  • Dabei wird als Dosismaß die Partikelmasse unter Berücksichtigung der Stoffdichte aus dem Tierexperiment eingesetzt. Partikelgrößenverteilung und Dosismaß werden für den Menschen übernommen.
    Eine Auswahl verschiedener Partikelgrößenverteilungen bei Tier und Mensch ist im Rahmen einer ERB-Ableitung nicht vorgesehen. Auch wenn andere Situationen an verschiedenen Arbeitsplätzen möglich erscheinen, sind die besten verfügbaren Informationen zu Effekten in Bezug auf definierte Partikelgrößenverteilungen aus dem Tierexperiment heranzuziehen.
    Sofern Agglomerate vorliegen, wird teilweise vorgeschlagen, abweichend die „Agglomeratdichte“ statt der Stoffdichte zu berücksichtigen: Da die Agglomeratdichte in nur wenigen Fällen bekannt ist, sollte im Allgemeinen – um die Vergleichbarkeit der Ergebnisse der einzelnen Betrachtungen zu gewährleisten –, die Stoffdichte verwendet werden.
    Unabhängig hiervon sei darauf hingewiesen, dass die Agglomeratdichte im Vergleich zur Stoffdichte max. bis zu 25 % geringer sein kann. Der Einfluss dieses Unterschiedes auf die Ergebnisse der Berechnung der deponierten Dosis mit Hilfe der MPPD-Software ist sehr klein.
  • ELRH/ELRT
    Das Verhältnis der Eliminationsraten ELRH/ELRT für schwer lösliche Stäube wird mit dem Faktor 0,15 erfasst. Bei Partikeln mit mittlerer Löslichkeit verdoppelt sich dieser Faktor auf 0,3, bei noch höherer Löslichkeit wird das Verhältnis der Eliminationsraten nicht berücksichtigt (ELRH/ELRT = 1)
    Der Faktor für schwer lösliche Substanzen ergibt sich aus der Eliminationshalbwertszeit für granuläre biobeständige Stäube (GBS) im Alveolarbereich von 60 d (Ratte) und 400 d (Mensch). Es lässt sich eine Eliminationsrate (= ln2/Eliminationshalbwertszeit) von 0,0116/d für die Ratte und 0,00173/d für den Menschen errechnen (Hartwig, 2012). Diese Berechnungsmethode enthält Ungenauigkeiten, insbesondere bei Stoffen, die nicht den GBS zuzuordnen sind, kann jedoch als konservativer orientierender Maßstab herangezogen werden und scheint besser geeignet zu sein als eine abweichende Berechnung über MPPD.
    Bei besser löslichen Stäuben ist neben der mechanischen Ausscheidung mit einer „Clearance“ über Löslichkeit (z. B. auch im sauren Milieu der Lysosomen nach Endozytose) zu berücksichtigen. Allerdings gibt es auch Anhaltspunkte für eine längere Retention von löslichen (Metall-)Partikeln im Alveolarbereich (z. B. bei Proteinbindung). Sofern eine entsprechende Makrophagenclearance erfolgt, kann dies teilweise zu Speziesdifferenzen führen. Aus diesem Grunde wird der Einfluss der unterschiedlichen Eliminationsraten bei höherer Löslichkeit mit geringerem Gewicht (0,3 statt 0,15) berücksichtigt. Bei sehr starker Löslichkeit wird im Standardfall kein Unterschied der Eliminationsraten angenommen.
    Eine Angabe, was unter guter oder mittlerer Löslichkeit im Zielgewebe zu verstehen ist, ist derzeit jedoch nicht (etwa anhand von Wasserlöslichkeitsdefinitionen nach ECHA-Guidance) generalisierbar. Zur Festlegung ist die Informationsbasis im Einzelfall einzubeziehen und die Entscheidung ist zu erläutern. So wird zum Beispiel Zinkoxid (relativ niedrige Wasserlöslichkeit von 1,6 mg/l) sehr schnell aus der Lunge eliminiert (Pauluhn et al., 2003), so dass Speziesunterschiede in der Clearance vernachlässigbar werden. Die Halbwertszeiten von Natriumpertechnetat (gut wasserlöslich) und Tetraphenylarsoniumpertechnetat (mittlere Wasserlöslichkeit) in der Lunge von Freiwilligen unterscheiden sich nicht (Kopunec et al., 1996; Walker et al., 2001).
    Aus den oben genannten Faktoren wird ein Faktor HEC/CT berechnet:
    HEC/CT = (AgVT/AgVH) x (NFH/NFT) x (ELRH/ELRT) x (DFT/DFH).
    (1)
    Daraus folgt für schwer lösliche Stäube:
    HEC/CT = 0,008 x 150 x 0,15 x (DFT/DFH) = 0,18 x (DFT/ DFH),
    (2)
    für mittellösliche Stäube:
    HEC/CT = 0,008 x 150 x 0,3 x (DFT/DFH) = 0,36 x (DFT/DFH)
    (3)
    für sehr gut lösliche Stäube:
    HEC/CT = 0,008 x 150 x (DFT/DFH) = 1,2 x (DFT/DFH).
    (4)
(2) Die Anwendung des Interspezies-Extrapolationsfaktors HEC/CT hat keine Auswirkungen auf die Höhe des Variabilitätsfaktors (Intraspezies- und Interspeziesvariabilität), der (nur) bei nichtkanzerogenen Effekten berücksichtigt wird (siehe auch Abschnitt 6.2).
(3) Das Dosimetriemodell MPPD 2.11 und die Berechnung HEC/CT ist in folgenden Fällen im Standard nicht anwendbar:
  • Bei Partikelgrößen > 3 μm sind die Ungenauigkeiten der Modellierung nach praktischen Erfahrungen zu groß, so dass die vorliegende Version des MPPD (2.11) für sie nicht herangezogen werden sollte.
    Es liegen Erfahrungswerte für Partikelgrößen > 3 μm vor, die sich besser mit früheren MPPD-Versionen (insbesondere MPPD 2.01) decken.
  • Wenn tierexperimentelle Daten nicht auf Rattenstudien basieren (sondern z. B. auf Mäuse- oder Hundestudien).
    In diesem Fall kann für die Maus das RDDR-Modell der U.S.EPA (1994) herangezogen werden, das (weniger abgesicherte) Depositionen berechnet. Humandaten können weiterhin mit der MPPD-Software berechnet werden.
    Für andere Spezies liegen keine geeigneten Dosimetriemodelle vor, die im Standardfalle angewendet werden könnten.
  • Wenn deutliche „Overload“-Phänomene für die beobachteten Effekte maßgeblich sind.
    In diesem Fall kann zwar der Interspeziesfaktor wie ohne „Overload“ verwendet werden, wenn die Effekte zumindest teilweise auf die spezifische Toxizität der Substanz zurückgeführt werden. Der resultierende Wert enthält jedoch zusätzliche Unsicherheiten. Bei reinen Partikeleffekten (vgl. GBS, granuläre biobeständige Stäube ohne bekannte stoffspezifische Toxizität) sollte keine ERB-Modellierung mit dem MPPD-Modell im „Over-load“-Bereich herangezogen werden.
  • Wenn beobachtete Effekte eindeutig nicht mit der deponierten oder retinierten Dosis korrelieren.
    Treten zum Beispiel Effekte durch Partikel eindeutig nur im tracheobronchialen Bereich der Versuchstiere auf und nicht im Alveolarbereich, obwohl relevante oder gar hohe Deposition auch im Alveolarbereich stattfindet, dann ist die hier gewählte Standardnormalisierung und die gewählte Depositionsfraktion im gesamten unteren Respirationstrakt unangemessen. Für diesen Fall kann in diesem Leitfaden kein Standardverfahren angegeben werden (Vorgehensweise ist im Einzelfall zu begründen).
  • Wenn die formale Berechnung mit dem Modell zu einem Gesamtfaktor HEC/CT von unter 0,05 (Interspezies-Extrapolationsfaktor > 20) führt.
    Das hier vorgesehene Abbruchkriterium ist nicht gut durch Daten gestützt. Es konnte jedoch gezeigt werden, dass die einzelnen Annahmen im dosimetrischen Modell, insbesondere in der Normalisierung und im Dosismaß mit erheblichen Unsicherheiten verknüpft sind. Vor diesem Hintergrund wurde eine vorsichtige Herangehensweise gewählt, die sich deutlich anlehnt an
    1. bestehende Extrapolationspraxis bei schwer löslichen Partikeln, und
    2. an der übergreifenden Erkenntnis, dass Tier und Mensch auch bei krebserzeugender
    Wirkung auch unter Berücksichtigung toxikokinetischer Differenzen vermutlich etwa gleich empfindlich sind.
    Für diesen Fall kann in diesem Leitfaden kein Standardverfahren angegeben werden (Vorgehensweise ist im Einzelfall zu begründen).
Fußnote 16)
verfügbar über www.baua.de mit diesem Titel

4.4   Vorgehen bei Vorliegen einer tierexperimentellen Studie mit oraler Applikation

(1) Wenn keine studienspezifischen Informationen zu einer relevanten körpergewichtsbezogenen Dosis vorliegen, sondern nur Konzentrationen im Futter oder Wasser berichtet sind, können folgende Standardwerte zur Umrechnung verwendet werden (ECHA, 2012b).
Tabelle 1: Standardwerte für Nahrungsmittel-, Trinkwasserverbrauch und Körpergewicht verschiedener Versuchstierspezies nach EFSA (2010)
Default values for body weights, food and water intake for the calculation of doses in lifetime studies
Experimental animalSexBody weight (kg)Food con-sumption per daya (g)Water consumption per daya (ml)
MouseMale0.033.6(120)5(167)
 Female0.0253.25(130)5(200)
RatMale0.520(40)25(50)
 Female0.3517.5(50)20(57)
HamsterMale0.12511.5(92)15(120)
 Female0.11011.5(105)15(136)
a) In brackets the daily food or water consumption is given in g or ml per kg body weight per day, as appropriate.
(2) Eine im Tierexperiment applizierte Dosis (Einheit: mg pro kg Körpergewicht und Tag; mg/kg x d) wird in eine humanäquivalente Dosis durch Berücksichtigung eines allometrischen Scalingfaktors transformiert. Im Default wird hierzu die Umrechnung über das allometrische Scaling nach Grundumsatz vorgenommen [(Körpergewicht-Mensch/Körpergewicht-Tier)0.25]. Es ergeben sich gerundet Faktoren von
  • Hund, Affe 2
  • Ratte 4
  • Maus 7
Die Berücksichtigung eines Scalingfaktors bei zugrunde liegender Oralstudie ist kein konservativer Extrapolationsschritt, sondern stellt im Standardfall eine biologisch begründete Datenanpassung dar (vgl. TGD, Abschnitt 4.14.2.4, auch Tabelle 11 (Scalingfaktoren bei Standardgewichten); EPA, (2005a); Kalberlah und Schneider (1998).
(3) Die humanäquivalente Dosis ist im Folgeschritt in eine Luftkonzentration umzurechnen. Differierende pfad-spezifische Resorptionsquoten sind bei einer Pfad-zu-Pfad-Extrapolation zu korrigieren. Allerdings können bestimmte Gründe gegen eine „Pfad-zu-Pfad-Extrapolation“ sprechen, insbesondere:
  • ausgeprägter First-Pass-Effekt,
  • es sind bei inhalativer Exposition lokale Tumoren im Respirationstrakt zu erwarten (besonders bei lokal wirksamen aber auch persistenten Stoffen sowie Metallverbindungen relevant),
  • lokale Tumoren nach oraler Applikation spielen eine bewertungsrelevante Rolle (z. B. Vormagentumoren im Nager),
  • es sind deutlich abweichende Organkonzentrationen im kritischen Zielorgan bei Inhalation zu erwarten und bewertungsrelevant (z. B. bei Studien mit Schlundsondenapplikation oft maßgeblich).
    Die Grenzen der Pfad-zu-Pfad-Extrapolation wurden z. B. bei der Erarbeitung des ARW-Konzepts im Ausschuss für Gefahrstoffe ausgewiesen (AGS, 2006; 2010).
(4) Ist bei einer Studie mit oraler Applikation keine Pfad-zu-Pfad-Extrapolation möglich und liegen keine Inhalationsstudien oder Erkenntnisse mit inhalativer Aufnahme des Kanzerogens beim Menschen vor, ist in der Regel keine Risikoquantifizierung möglich (vgl. Abschnitt 8).

4.5   Vorgehen bei Studien mit verkürzter Expositions- und/oder Beobachtungsdauer

(1) Wurde die Exposition vor Experimentende gestoppt (längere Beobachtungszeit nach der Expositionszeit), so ist eine Korrekturrechnung vorzunehmen. Bei einer angenommenen experimentellen Spanne von 100 Wochen bedeutet das zum Beispiel:
tatsächliche Exposition: 70 Wochen lang 50 ppm im Futter, 30 Wochen Nachbeobachtung:
kalkulierte Exposition: 50 ppm x 70/(30 + 70) = 35 ppm für die gesamte experimentelle Spanne.
Wenn alle Tiere einer Dosisgruppe vorzeitig sterben, wird die Expositions- und Lebenszeit des langlebigsten Tiers für die Umrechnung zugrunde gelegt.
Quelle: (Gold et al., 2005)
Wenn eine Expositionsdauer von ca. 100 Wochen im Tierversuch in ein Humanäquivalent umgerechnet wird, übersteigt dieses Äquivalent die anteilige Lebensarbeitszeit von ca. 40 Jahren. Auch wenn in weiteren Schritten von Lebenszeitexposition auf Exposition über Lebensarbeitsdauer rückgerechnet wird, stellt es also einen konservativen Ansatz dar, die Beobachtungen nach dieser längeren Expositionsspanne für die Quantifizierungen zu Grunde zu legen.
(2) Ist die Experimentspanne kleiner als die Lebensspanne, erfolgt in der Regel eine weitere Korrektur von Experimentalspanne auf Lebensspanne mit Korrekturfaktor f2, mit f = Experimentalspanne/Standard Lebensspanne (Bsp. Experiment nach 100 w beendet, Standard-Lebensspanne 104 w: Korrekturfaktor = (100/104)2 = 0,92). Als Standard-Lebensspannen werden angenommen: Maus, Ratte, Hamster: zwei Jahre, Hund: elf Jahre, Affe (Macaca): 20 Jahre
Auch Dybing et al. (1997) wählen bei ihrem T25-Konzept einen entsprechenden Ansatz (siehe auch Abschnitt 0 (3)):
Verkürzte Exposition (w1) gegenüber der Gesamtversuchsdauer (w2 Wochen): Korrekturfaktor f = w1/w2
Verkürztes Experiment (w1) gegenüber Gesamtlebensspanne (w2 Wochen): Korrekturfaktor f = (w1/w2)2
Bei dieser „Standard-Lebensspanne“ handelt es sich um eine wenig konservative Konvention. Abweichend von diesem Standard kann es insbesondere bei Ratten mit Lungentumoren erforderlich sein, eine verlängerte Lebensdauer anzunehmen. Bei der Ratte treten expositionsbedingte Lungentumoren vor allem im Alter von mehr als zwei Jahren auf. Die Spontanrate für Lungentumoren ist bei Ratten niedrig, nach 2,5 Jahren um 1 bis 2 % stammesabhängig etwas höher oder noch niedriger. Die Beobachtungszeit sollte für die quantitative Risikoabschätzung dort unbedingt mehr als zwei Jahre betragen. So heißt es bei McConnell und Swenberg (1994): „Following the 24-mo exposure period, the animals were held for lifetime observation (until ~20 % survived)“. Dies impliziert, dass 24 Monate keine Lebenszeit-Beobachtung sind, dass aber aus pragmatischen Gründen ein bestimmtes Kriterium (hier 20 % Überlebensquote) zur Definition der „Lebenszeit“ (länger als 24 Monate) verwendet werden kann.
(3) Im Falle einer Absenkung der Expositionskonzentration während des Versuchs wird in der Regel das zeitgewichtete Mittel für die Expositionshöhe herangezogen.
Der einfache Ansatz eines kumulativen Dosismaßes über die gesamte Lebenszeitspanne (nach Druckrey, siehe unten) berücksichtigt nicht, dass ein krebserzeugender Stoff spezifisch eine oder mehrere Stufen der Kanzerogenese auszulösen vermag. Wenn ein frühes Stadium der Kanzerogenese betroffen ist, sind Expositionen am Anfang des Lebens besonders kritisch. Persistierende Substanzen können auch nach einem frühen Abbruch der Behandlung eine anhaltende innere Belastung aufrechterhalten.
Die „Guidelines for Carcinogen Risk Assessment“ (2005) der U.S.EPA geben zu bedenken17): „For chronic exposure studies, the cumulative exposure or dose administered often is expressed as an average over the duration of the study, as one consistent dose metric. This approach implies that a higher dose administered over a short duration is equivalent to a commensurately lower dose administered over a longer duration. Uncertainty usually increases as the duration becomes shorter relative to the averaging duration or the intermittent doses become more intense than the averaged dose. Moreover, doses during any specific susceptible or refractory period would not be equivalent to doses at other times. For these reasons, cumulative exposure or potential dose may be replaced by more appropriate dose metric when indicated by the data.“
Zum Multistage- und Moolgavkar-Modell gibt es beispielsweise mathematische Anpassungsvorschläge für intermittierende und Kurzzeit-Expositionen in beliebigen Lebensabschnitten (Chen et al., 1988; Crump und Howe, 1984; Yamasaki, 1988). Diese erscheinen aber zu komplex für die routinemäßige Anwendung.
Nach der Druckrey´schen Regel ist die Tumorgenität das Ergebnis einer im Laufe des Lebens einwirkenden Gesamtdosis (d x t = const.). Diese Beschreibung hat für viele gentoxische Stoffe Gültigkeit. Sie berücksichtigt allerdings keine Depoteffekte, d. h. konstante Einwirkungen schwerlöslicher oder anderweitig biopersistenter Stoffe nach Inhalation oder Injektion (wie z. B. Metallverbindungen, Asbest, Holzstaub). Die Druckrey´sche Regel kann auch die Spätfolgen kurzfristig einwirkender hoher, gewebsschädigender Dosen unterschätzen, etwa weil gesteigerte Zellproliferationsraten die Empfindlichkeit der Zielgewebe erhöhen, gentoxische Läsionen fixiert und Einwanderung von Stammzellen in Zielgewebe begünstigt werden. Die Druckrey´sche Regel ist jedoch die Grundlage der linearen Dosisextrapolation und auch der üblichen Zeitextrapolation.
Literatur: Chen et al. (1988); Yamasaki (1988); Crump und Howe (1984); Dybing et al. (1997)
(4) Experimente, bei denen die Expositionszeit weniger als die Hälfte der Standard-Lebensspanne dauern, sind für eine Risikoquantifizierung nicht geeignet. Die Beobachtungsdauer in einem Versuch mit Mäusen sollte in der Regel nicht unter 18 Monaten liegen, in einem Versuch mit Ratten nicht unter zwei Jahren.
In grober Annäherung entspricht die Hälfte der Standard-Lebensspanne etwa dem Verhältnis zwischen Lebensdauer und Lebensarbeitszeit beim Menschen. Damit ist z. B. eine Expositionsdauer von 1 Jahr (Ratte) in der Regel ausreichend, um die entsprechenden Tumorbefunde quantitativ verwerten zu können. Ist jedoch die Nachbeobachtungszeit kurz, sind relevante Risikounterschätzungen zu befürchten.

4.6   Normierung der täglichen Expositionsdauer

(1) Für die Exposition am Arbeitsplatz gelten folgende Standardannahmen: Expositionsdauer während des Arbeitslebens: 40 Jahre, Dauer des Arbeitstags: acht Stunden, Wochenarbeitszeit: 5 d, Jahresarbeitszeit: 48 Wochen; Körpergewicht: 70 kg, Atemvolumen: 10 m3/Arbeitstag (8 h). Eine Umrechnung vorliegender abweichender Expositionsmuster auf diese Standardannahmen erfolgt in der Regel linear. Liegen Erkenntnisse aus der Allgemeinbevölkerung vor, so werden bei dieser, wenn im Einzelnen nicht anders angegeben, folgende Expositionsparameter unterstellt: Expositionsdauer: 75 Jahre, Körpergewicht: 70 kg, Nahrungsaufnahme/Tag: 1,4 kg, Wasseraufnahme/Tag: zwei Liter, Atemvolumen: 20 m3/Tag (24 h).
Zur Umrechnung auf Basis des Tierexperiments ist darauf zu achten, dass keine Doppelberechnung erfolgt: Nach Abschnitt 4.2 (1) erfolgt bereits eine Umrechnung von 6 h/d (Ruhebedingungen, Tierexperiment) auf 8 h/d (leichte Aktivität; Arbeitsplatz) über einen Faktor Zwei.
(2) Bei Extrapolation vom Tierexperiment auf den Menschen ist in der Regel die experimentelle Expositionsdauer (pro Tag, pro Woche) angegeben und wird linear auf die oben genannte Zeitdauer (berufliche Exposition) umgerechnet.
Dieser Ansatz geht von der biologischen Modellannahme aus, dass die kumulative Dosis (c x t) einer Einwirkung das Risiko bestimmende Dosismaß darstellt. Dieses Vorgehen wird (für den Standardfall) gewählt, obwohl bekannt ist, dass es sich hier meist um einen konservativen Vereinfachungsschritt handelt. Die Parameter wurden in ihrer Höhe vom Technical Guidance Document der EU übernommen (vgl. dort Abschnitt 4.14.2.5 und Tabelle 12).

5   Extrapolation auf niedrigere Risikohöhen

5.1   Festlegung des Vorgehens nach dem Wirkprinzip

(1) Wurde nach den Erkenntnissen in Abschnitt 2 ein im Wesentlichen durch die direkte Gentoxizität determiniertes Wirkprinzip für die Kanzerogenese festgestellt, so erfolgt im Standardfall eine lineare Extrapolation.
Eine lineare Extrapolation ist im aktuellen Kontext nicht wissenschaftlich abzusichern und entspricht einer konservativen Konvention. Auch bei direkter Gentoxizität ist es bei einzelnen Stoffen möglich, dass sublineare Verläufe bei sehr niedrigen Expositionshöhen vorliegen, wobei in der Regel die Datenlage nicht ausreicht, um die Sublinearität näher zu beschreiben oder die Substanzen, bei denen eine solche Sublinearität bei gleichzeitiger Gentoxizität gerechtfertigt anzunehmen wäre, zu benennen. Deshalb erfolgt bei entsprechend limitierter Datenlage eine lineare Extrapolation.
(2) Wurde nach den Erkenntnissen in Abschnitt 2 festgestellt, dass das Wirkprinzip alleine durch nichtgentoxische Ereignisse geprägt ist und kann für den oder die bestimmenden Parameter eine Dosis-Wirkungsbeziehung mit einer Wirkschwelle ermittelt werden, so ist diese zur Ableitung heranzuziehen.
Zur Abgrenzung zwischen „keiner“ Gentoxizität und „nachgeordneter“ Gentoxizität vgl. Abschnitt 2.4.
(3) Ist kein Wirkprinzip bekannt oder ausreichend gesichert, erfolgt im Standardfall eine lineare Extrapolation.
In vielen Fällen dürften in der Realität sublineare Verläufe bei sehr niedrigen Expositionshöhen vorliegen, wobei jedoch oft nicht mit genügender Sicherheit angegeben werden kann, ab welcher Konzentration das Risiko überproportional ansteigt („Knickstelle“ in hier gewählter Approximationsmethode), so dass bei entsprechend limitierter Datenlage ebenfalls eine lineare Extrapolation erfolgt.
(4) In Fällen, in denen das Wirkprinzip zwar im Wesentlichen bekannt ist, jedoch a) eine direkte Gentoxizität keine dominierende Bedeutung besitzt, b) keine eindeutige Wirkschwelle für die Kanzerogenität vorliegt oder c) eine Schwelle aufgrund der Datenlage nicht quantifiziert werden kann, wird in der Regel ein sublinearer Dosis-Wirkungs-Verlauf in den Niedrigrisikobereich unterstellt.
Es wird jedoch linear extrapoliert, wenn keine Daten vorliegen, die es ermöglichen, die Sublinearität abzuschätzen (wenn also unklar ist, in welchem Konzentrationsbereich das Steigungsmaß für das Krebserkrankungsrisiko zunimmt).
Zum Begriff der „Wirkschwelle“ sind die Ausführungen im Abschnitt 2.6 zu beachten. Grundsätzlich ist ein NOAEL für kanzerogene Effekte (keine beobachtete signifikant erhöhte Inzidenz gegenüber Hintergrund) quantitativ nicht mit einer Schwelle gleichzusetzen.
(5) In Zweifelsfällen über die Zuordnung zu (1) bis (4) ist über parallele Risikoquantifizierungen nach verschiedenen Methoden (vgl. Abschnitt 5.2) zu prüfen, ob sich Unterschiede für die Ergebnisse ergeben und wie relevant die Festlegung auf ein Wirkprinzip tatsächlich ist. Ggf. ist bei nahe zusammenliegenden Dosis-Risikoverläufen eine Entscheidung für ein vorherrschendes Wirkprinzip nicht notwendig, um trotzdem eine Risikoquantifizierung ohne relevanten Fehler vorzunehmen. Die Unsicherheit in der Risikoquantifizierung ist zu dokumentieren. Für den Fall, dass die verschiedenen Risikoquantifizierungen zwar für Expositionen mit erhöhtem Risiko noch zu vergleichbaren Risikokonzentrationen führen (z. B. bei zusätzlichen Lebenszeitrisiken bis in den Promillebereich), jedoch bei niedrigeren Risiken gravierende Abweichungen auftreten, ist der Gültigkeitsbereich entsprechender Expositions-Risikoverläufe abzugrenzen.
(6) Eine Risikoextrapolation in den Niedrigrisikobereich unter Verwendung derjenigen Modellfunktion, die für den experimentellen Bereich die beste Anpassung an die Daten gezeigt hat, ist in der Regel kein geeignetes Vorgehen. Es ist z. B. möglich, dass im experimentellen Bereich Supralinearität vorliegt, jedoch Sublinearität im Niedrigrisikobereich.
Diese Aussage widerspricht der in Abschnitt 3.2 (3) und 5.2 (2) eingeführten Konvention, die Benchmarkmethode bei belegter Sublinearität als Ersatz für das linearisierte Multistage-Modell als mechanistisch begründet für den experimentellen Bereich und den Niedrigrisikobereich zu verwenden. Diese Modellierung wird dort jedoch deshalb für die Extrapolation herangezogen, weil sie in einfacher Form eine Sublinearität beschreibt. Es ist jedoch nicht zu schlussfolgern, dass mit diesem Vorgehen die „richtige“ Steigung im Niedrigrisikobereich gefunden wird.

5.2   Extrapolation auf niedrigere Risikohöhen bei nichtlinearem Verlauf

(1) Bei einer Informationslage entsprechend Abschnitt 5.1 (4), 1. Absatz, ist mit hinreichender Wahrscheinlichkeit ein nichtlinearer Expositions-Wirkungsverlauf anzunehmen. In diesem Fall wird eine plausible Festsetzung für diese nichtlineare Funktion vorgenommen.
(2) Ist die Datenlage hinreichend qualifiziert, dass das Benchmarkverfahren eingesetzt werden kann, dann wird unterstellt, dass die Benchmarkmodellierung auch die Nichtlinearität in dem Risikobereich ≥ 1:1.000 ausreichend genau abbildet. Dies auch dann, wenn der allgemeine methodische Gültigkeitsbereich nur den experimentellen Bereich der Risiken größer z. B. 1 % oder 5 % abdeckt. Zwischen der so ermittelten BMD0,1 (1:1.000) und dem Ursprung oder Hintergrundniveau wird linear extrapoliert.
Der Bezug zur BMD statt zur BMDL ist deshalb gerechtfertigt, weil a) es sich bei der Orientierung an der BMD um die Schätzung mit der höchsten Wahrscheinlichkeit handelt (maximum likelihood), b) nach Abschnitt 5.1 (4) zusätzliche inhaltliche Gründe vorliegen müssen, die einen nichtlinearen Verlauf stützen, so dass Modellierungen, die über die BMDL mathematisch als möglich angesehen werden müssten, aus diesen inhaltlichen (z. B. mechanistischen) Gründen als unwahrscheinlich angesehen werden und c) aufgrund der Qualitätskriterien Benchmarkmodellierungen nur dann als adäquat angesehen werden, wenn die Unterschiede zwischen BMD und BMDL gering sind. Wird also eine BMD statt einer BMDL zugrunde gelegt, ist so nicht mit einer relevanten Risikounterschätzung zu rechnen (selbst wenn „in Wirklichkeit“ die BMDL das Risiko korrekter widerspiegeln sollte). Ferner ergibt dieses Vorgehen eine methodische Kontinuität zur T25, in die ebenfalls keinen Vertrauensbereich eingerechnet wird.
Die folgenden Beispiele (Fall A, B) zeigen eine Abgrenzung zwischen einem Fall mit Nichtlinearität (Fall A) und Linearität (Fall B). In Fall A wären zusätzliche mechanistische Hinweise erforderlich, die die Nichtlinearität stützen. Können diese nicht gegeben werden, stellt die BMD10 den POD dar, unterhalb dessen eine lineare Extrapolation erfolgen würde.
FALL A: Gute Datenlage verweist auf nichtlineare Verhältnisse
Konzentration (mg/m3)Anzahl
Tiere
Anzahl
Tumoren
Kommentar:
0500
Verlauf spricht für eine deutliche Nichtlinearität;
gute Datenlage; z. B. mechanistische Hinweise auf Nichtlinearität
10501
50500
2005010
10005045
Ergebnis, graphisch:
Ergebnis in Zahlen, Erläuterung:
ModellBMD10BMDL10BMDL0,1 =
1 Promille
BMD0,1 =
1 Promille
T25T25/250 =
1 Promille
 15111122402350,94
Kom­mentar 1:Unterschied 40/0,94 zeigt, dass BMD (1 Promille) deutlich geringeres Risiko ausweist als der bei dieser Datenlage nicht geeignete T25-Ansatz40<– –>0,94
Kom­mentar 2:Der geringer Unterschied zwischen 151 und 111 (bzw. 40 und 22) zeigt, dass kein relevanter Unterschied zwischen BMD und BMDL bei guter Datenlage besteht
Kom­mentar 3:Es wurde mit log Probit modelliert. Aufgrund des niedrigsten AIC-Wertes (AIC = 100,87) wurde dieses Modell ausgewählt.
FALL B: Mittlere Datenlage lässt nichtlineare oder lineare Verhältnisse zu
Konzentration (mg/m3)Anzahl
Tiere
Anzahl
Tumoren
Kommentar:
0500
Verlauf schließt Nichtlinearität nicht aus, doch auch Linearität möglich;
mittlere Datenlage (Kriterien nach Leitfaden 3.1 erfüllt)
10501
2005010
10005045
Ergebnis, graphisch:
Ergebnis in Zahlen, Erläuterung:
ModellBMD10BMDL10BMDL0,1 =
1 Promille
BMD0,1 =
1 Promille
T25Linear:
T25/250 =
1 Promille
 99580,561,12310,92
Kom­mentar 1:Unterschied 0,92/1,1 zeigt, dass BMDL (1 Promille) fast identisches Risiko ausweist wie T25-Ansatz, da Linearität möglich (siehe Graphik)1,1<– –>0,92
Kom­mentar 2:Der Unterschied zwischen BMD und BMDL ist nicht erheblich
Kom­mentar 3:Es wurde mit Multistage (2 Freiheitsgrade) modelliert. Aufgrund des niedrigsten AIC-Wertes (AIC = 98,86) wurde dieses Modell ausgewählt. Hinweis: Aufgrund der Anmerkung in Abschnitt 3.3 (1), dass das „Quantal-linear“-Modell nicht verwendet werden soll, wurde dieses hier ausgeschlossen.
(3) Wurde die T25 als POD für das Krebsgeschehen herangezogen, dann wird für den Fall begründeter Nichtlinearität vorausgesetzt, dass eine nichtkanzerogene Wirkung als Verstärkungsmechanismus (z. B. Reizung im Respirationstrakt, Zytotoxizität in der Niere) zum Krebsgeschehen in höherer Dosierung maßgeblich beiträgt und quantitativ beschrieben wer-den kann. Die Ermittlung des anzunehmenden Expositions-Risiko-Verlaufs erfolgt dann in vier Schritten.
  • Schritt 1: Für die für sich nicht kanzerogene verstärkende Wirkung wird eine humanäquivalente Wirkschwelle (TC*; als Konzentration in der Luft) ermittelt, wobei die üblichen Extrapolationsfaktoren berücksichtigt werden.
    Die Extrapolation nichtkanzerogener Wirkungsdaten werden nach dem AGW-Konzept durchgeführt (AGS, 2006; 2010).
  • Schritt 2: Ausgehend von der normalisierten und als Humanäquivalent umgerechneten T25 (hT25) wird linear zum Ursprung oder Hintergrundniveau das Krebsrisiko 10-p zur Konzentration TC* berechnet.
  • Schritt 3: Der Konzentration TC* wird dann pragmatisch ein zehnfach geringeres Krebsrisiko (eine Größenordnung: 10-(p-1)) als nach linearer Extrapolation zugewiesen.
  • Schritt 4: Schließlich wird von dem Punkt „TC* und 10-(p-1)“ jeweils linear einerseits hoch zur hT25 und andererseits herunter zum Ursprung (oder zum Hintergrundniveau) extrapoliert. Anhand des so approximierten sublinearen Expositions-Risikoverlaufs kann das nominelle Risiko für jeden Punkt zwischen dem Ursprung (oder Hintergrundniveau) und der hT25 ermittelt werden, wobei die Knickstelle der Funktion bei der extrapolierten Wirkschwelle (TC*) für den Beginn des Verstärkungsmechanismus steht.
Mit dieser Vorgehensweise entsprechend einem „hockey-Stick“-Verlauf wird Nichtwissen überbrückt. Denn in der Regel ist zwar bekannt, wann ein nichtlinearer Verlauf für die Expositions-Risikobeziehung zu unterstellen ist, weitere Parameter, die die Nichtlinearität des Krebsgeschehens quantitativ beschreiben könnten, sind jedoch häufig nicht bekannt. Der unbekannte Grad des „Durchhängens“ der sublinearen Funktion wird durch einen Abschlagsfaktor an der extrapolierten Schwelle der Wirkungsverstärkung ersetzt.
Die folgende Abbildung 2 zeigt prinzipiell die oben genannten Schritte in dem Fall, dass für das Krebsgeschehen eine hT25 vorliegt, einschließlich genügender Daten, um für einen Verstärkermechanismus eine Wirkschwelle (TC*) zu ermitteln (Erläuterung siehe Text):
Abbildung 2: Prinzipielle Darstellung zur Approximation einer sublinearen Expositions-Risiko-Beziehung durch eine Knickfunktion (Erläuterungen siehe Text)
Abbildung 2: Prinzipielle Darstellung zur Approximation einer sublinearen Expositions-Risiko-Beziehung durch eine Knickfunktion (Erläuterungen siehe Text)
Für die Berechnung der T25 sind zuvor die in den Abschnitten 0, 4.2 und 4.5 beschriebenen erforderlichen Normierungen vorzunehmen.
Ein Beispiel zur Berechnung ist der Literatur zu entnehmen18).

5.3   Extrapolation bei angenommenem Schwellenphänomen

(1) Wird eine Mindestdosis oder Wirkschwelle für die Kanzerogenese angenommen (Abschnitt 5.1 (2)), so ist die Schwellendosis auf Basis vorliegender experimenteller Daten unter Einschluss bestimmter Extrapolationsfaktoren zu quantifizieren. Es wird vorausgesetzt, dass in diesem Falle weder direkte Gentoxizität noch andere Wirkprinzipien ohne Schwelle eine Rolle spielen.
(2) Für die Festlegung der Schwellendosis sind besonders sorgfältig gerade auch frühe Anzeichen (Indikatoren) der entsprechenden relevanten kritischen Veränderung zu erfassen. Z. B. wären bei krebsrelevanter Nephrotoxizität auch erste Frühschäden in der Niere einzubeziehen, die z. B. durch entsprechende Eiweißausscheidungen angezeigt werden. Für diese selbst nicht krebserzeugende, jedoch für die Krebsentstehung als maßgeblich angesehene Wirkung sind Dosis-Wirkungsbeziehung, LOAEL und/oder NOAEL zu ermitteln.
(3) Liegen keine differenzierten Studienbefunde zu frühen Schädigungen vor, die als maßgeblich für die krebserzeugende Wirkung angesehen werden, kann dies über konservative Extrapolationsfaktoren ausgeglichen werden. In diesem Sinne erfordert die Festlegung z. B. einer Reizschwelle für einen nicht krebserzeugenden Stoff niedrigere Extrapolationsfaktoren als die Festlegung einer Reizschwelle für einen Stoff, bei dem sie ein wichtiger Parameter für das Wirkprinzip des Krebses darstellt.
(4) Aus diesem Grunde wird neben den üblichen Extrapolationsfaktoren ein zusätzlicher Faktor von in der Regel 10 berücksichtigt. Vor dem Hintergrund des möglichen Folgeeffekts Krebs soll die Wirkschwelle so besonders sicher angegeben oder unterschritten werden. Nach der Terminologie in Abschnitt 5.2 liegt damit diese konservative Wirkschwelle bei TC*/10, wobei TC* sich hier nicht auf krebsverstärkende sondern auf krebsauslösende Wirkungen bezieht.
Extrapolationen zur Berechnung von TC* verlaufen entsprechend der AGW-Methodik (AGS, 2010).
Versteht man den „üblichen“ NOAEL als einen Wert, der durchaus noch mit einem Effektniveau von 5 % verbunden sein kann (auch wenn im experimentellen System keine Wirkung mehr beobachtet wird), so wird über diesen Faktor 10 ein deutlich kleineres Effektniveau mit dem resultierenden NAEL zu verbinden sein (im Beispiel: Effektniveau 0,5 %).
Das Vorgehen deckt sich mit dem Verständnis der einzelnen Extrapolationsfaktoren als bestimmtes Perzentil einer Verteilung (z. B. 90-Perzentil beim Intraspeziesfaktor): die Wahl eines zusätzlichen Extrapolationsfaktors ist gleichbedeutend mit der Erhöhung z. B. des Intraspeziesfaktors zum Einschluss eines höheren Perzentils (z. B. 95-Perzentil) verschiedener Empfindlichkeiten, wird aber pauschal einbezogen (nicht auf einen Einzelfaktor wie Intraspeziesfaktor oder Interspeziesvariabilitätsfaktor oder Zeitfaktor bezogen, sondern auf Gesamtverteilung, i. e. multiplizierte Einzelfaktoren).
In einzelnen Fällen kann es sein, dass der Faktor 10 nicht oder nicht im vollem Umfang erforderlich ist, weil die betrachtete Expositionshöhe bei TC* in Verbindung mit der dabei anzunehmenden Wirkstärke bereits eine hohe Sicherheit vor adversen Effekten bietet. In diesem Fall kann (mit ausdrücklicher Begründung) ein kleinerer Faktor zur Ermittlung der konservativen Wirkschwelle herangezogen oder sogar auf einen solchen zusätzlichen Faktor gänzlich verzichtet werden.
(5) Für die Extrapolation der anzunehmenden Wirkschwelle wird in Verbindung mit dem Benchmarkverfahren für Krebsrisiken der Risikoverlauf entlang der modellierten Funktion (als BMD) bis zum Risiko 1 % (Benchmark-Response ein Prozent) berücksichtigt. Hierbei wird vorausgesetzt, dass die Qualitätsmaßstäbe zur Anwendung des Benchmarkverfahrens eingehalten sind (vgl. Abschnitt 3.3) und mechanistische Erkenntnisse dem modellierten Verlauf der Expositions-Risiko-Beziehung nicht widersprechen. Ein Risiko „Null“ wird dann pragmatisch bei einer BMD01/10 (entsprechend einem Benchmark-Response von einer Promille) angenommen.
Für die Quantifizierung der Expositions-Risiko-Beziehung im Bereich oberhalb der angenommenen Wirkschwelle erfolgt demnach im vorliegenden Leitfaden nur dann eine Vorgabe, wenn eine Benchmarkmodellierung erfolgte. Liegt keine Benchmarkmodellierung vor, wird die Wirkschwelle nach Abschnitt 5.3 (4) berechnet, jedoch keine allgemeine Aussage zum Verlauf der Expositions-Risiko-Beziehung oberhalb dieser Wirkschwelle gemacht (ggf. ist eine Einzelfallbetrachtung erforderlich).
Für den Fall, dass das Krebsgeschehen qualifiziert in einer Benchmarkmodellierung abgebildet werden kann, ergibt sich folgende Darstellung für das Extrapolationsverfahren. Die errechnete Wirkschwelle (BMD01/10) ist vor ihrer regulatorischen Anwendung auf ein Humanäquivalent (Arbeitsplatzszenario) umzurechnen.
Abbildung 3: Schematische Darstellung des Vorgehens bei Festlegung einer Wirkschwelle für Kanzerogene bei Vorliegen einer qualifizierten Benchmarkmodellierung mit gegebener BMD01
Abbildung 3: Schematische Darstellung des Vorgehens bei Festlegung einer Wirkschwelle für Kanzerogene bei Vorliegen einer qualifizierten Benchmarkmodellierung mit gegebener BMD

6   Regulatorisch-toxikologische Relevanz

Die Festlegung von Zäsurpunkten (der Höhe des Toleranz- oder Akzeptanzrisikos) und der Maßnahmen bei deren Einhaltung oder Überschreitung sind Entscheidungen des Risikomanagements (vgl. Risikokonzept des AGS19)). Diese sind in einem übergeordneten Zusammenhang (außerhalb dieses Leitfadens) zu treffen, müssen aber auch wissenschaftliche Erkenntnisse beachten. Die regulatorisch-toxikologischen Bezüge einzelner Elemente (i. W. bestehend aus dem vorliegenden Leitfaden und dem in der BekGS 901 dargestellten AGW-Konzept) des Gesamtkonzepts zueinander sowie einzelne relevante Punkte (z. B. endogene Belastungen, Expositionsspitzen) sind in diesem Abschnitt 6 dokumentiert.

6.1   Toleranz- und Akzeptanzkonzentrationen

(1) Auf Basis der Expositions-Risiko-Beziehung werden in der Regel den Zäsurpunkten Toleranzrisiko (nominelles Risiko von 4:1.000) und Akzeptanzrisiko (4:10.000 bis 2013 und 4:100.000 ab 2013, spätestens jedoch ab 2018) korrespondierende Toleranz- und Akzeptanzkonzentrationen zugerechnet. In Sonderfällen können Toleranz- und/oder Akzeptanzkonzentration andere Risikohöhen zugeordnet sein:
  • Sonderfall 1: Ein nach der Methodik der BekGS 901 abgeleiteter gesundheitsbasierter Grenzwert für einen nichtkanzerogenen Effekt eines krebserzeugenden Stoffes („AGW-analoger Wert“, vgl. 6.2 (1)) ist niedriger als die nach dem vorliegenden Leitfaden für den krebserzeugenden Effekt abgeleitete Toleranzkonzentration. In diesem Fall wird die Konzentration für den nichtkanzerogenen Effekt als Toleranzkonzentration ausgewiesen (vgl. Abschnitt 6.2).
  • Sonderfall 2: Handelt es sich um einen krebserzeugenden Stoff, der zugleich endogen gebildet wird, kann eine abweichende Akzeptanzkonzentration ermittelt werden, die mit einem anderen Risiko verbunden ist als das oben genannte Akzeptanzrisiko (vgl. Abschnitt 6.3).
  • Sonderfall 3: Sind die Mindestkriterien für die Krebsrisikoquantifizierung nicht erfüllt, können Punktschätzungen einen übermäßig spekulativen Charakter erhalten (vgl. Abschnitt 8.7).

6.2   Ableitung eines Vergleichswerts nach der Methodik der BekGS 901

(1) Neben einer Risikoquantifizierung nach ERB-Konzept für krebserzeugende Wirkung erfolgt für Kanzerogene zu Vergleichszwecken regelmäßig auch die Ermittlung eines Wertes zum Schutz vor nichtkanzerogenen Wirkungen. Dieser Vergleichswert wird im ERB-Begründungstext als „AGW-analoger Wert“20) bezeichnet, um auszudrücken, dass er für den kritischsten nicht krebserzeugenden toxikologischen Endpunkt nach der Methodik des entsprechenden AGW-Konzepts (AGS, 2010) für den o. g. Vergleichszweck ermittelt wurde. Handelt es sich um Partikel mit lokaler Wirkung auf den Atemtrakt, so wird das AGW-Konzept durch die Methodik zu „humanäquivalenten Konzentrationen“ (HEC) ergänzt.
Das HEC-Konzept wurde in Abschnitt 4.3 im Rahmen der Ableitung krebserzeugender Wirkungen dargestellt. Es ist auch für nichtkanzerogene Effekte im unteren Atemtrakt (Tracheobronchialbereich (TB) und pulmonaler Bereich (PU)) einsetzbar. Es gelten die gleichen Defaultannahmen wie für krebserzeugende Wirkung. Es ist jedoch zu erwarten, dass Abweichungen vom Default eher begründet und zu vertreten sind. Z. B. können Wirkungen leichter nur dem PU- oder nur dem TB-Bereich allein zugeordnet werden (besser begründete Abweichung in der Normalisierung) oder es kann klarer unterscheidbar sein, ob die deponierte oder die retinierte Konzentration wirkungsrelevant ist (z. B. ist es begründet, bei Effekten durch lösliche Substanzen, die bereits bei akuter Exposition wirksam sind, die deponierte statt der retinierten Dosis zugrunde zu legen).
(2) Der AGW-analoge Wert wird zur (gesundheitsbasierten) Toleranzkonzentration, wenn er unterhalb des Wertes liegt, der nach dem ERB-Konzept für das Risiko 4:1.000 ermittelt wurde. In diesem Fall wird der dem Risiko von 4:1.000 entsprechende Wert nicht als Ergebnis der ERB-Ableitung ausgewiesen.
Ein gesundheitsbasierter AGW-Wert (AGS, 2010) sollte nicht überschritten werden, auch dann nicht, wenn es sich um einen krebserzeugenden Stoff handelt, für den auf Basis des Risikos von 4:1.000 auch höhere Konzentrationen toleriert würden. Damit wird der in Anlage 1 definierte Bereich des „mittleren Risikos“ (vgl. auch Maßnahmenkonzept) kleiner. Dieser Wert ist dann gesundheitsbasiert durch nichtkanzerogene Effekte begründet. Die dem Krebsrisiko von 4:1.000 entsprechende Konzentration ist jedoch weiterhin im Begründungspapier zu berichten. Dies wäre auch dann der Fall, wenn der AGW-analoge Wert bei einem Risiko von z. B. 3:100.000 läge. In diesem Fall wäre zwar nach dem Maßstab der krebserzeugenden Wirkstärke bereits ein Akzeptanzniveau erreicht, jedoch nicht vor dem Hintergrund der nichtkanzerogenen Effekte. Es kommt somit zur Ausdehnung des Bereichs des hohen Risikos bis eventuell zum Bereich des niedrigen Risikos, das hieße, dass unterhalb der gesundheitsbasierten Toleranzkonzentration ein Krebsrisiko in bereits akzeptabler Höhe berechnet wurde.
Die nach dem jeweiligen Regelungsbereich etwas unterschiedlichen Konsequenzen bei Überschreitung eines nach AGW-Methodik bzw. nach ERB-Methodik berechneten Werts werden in Kauf genommen und der Begriff Toleranzkonzentration in jedem Fall für die Bezeichnung des Übergangs in den Bereich hoher Risiken herangezogen.
(3) Liegt der AGW-analoge Wert oberhalb des Toleranzniveaus von 4:1.000, so wird er zwar im Rahmen der Vergleiche dokumentiert, erhält jedoch keine regulatorische Bedeutung und wird im Ergebnis der ERB-Ableitung nicht ausgewiesen. Einschränkend ist zu beachten, dass auch nichtkanzerogene Effektkonzentrationen sich auf die Höhe des Überschreitungsfaktors (Abschnitt 6.4) bei Kurzzeitüberschreitungen der Toleranzkonzentration auswirken können.
Fußnote 20)
Der Terminus „AGW-analoger Wert“ ist nur für Begründungstexte (ERB) zu verwenden, jedoch nicht als isolierter Begriff in Listen mit regulatorischer Funktion (insbesondere nicht in TRGS 900) und nicht im Risikomanagement.

6.3   Endogen gebildete Kanzerogene

(1) Die Höchstkonzentration am Arbeitsplatz für auch endogen auftretende Stoffe oder ihre Metaboliten richtet sich nach der bereits endogen bestehenden Belastung. Dabei soll durch die zusätzliche Exposition am Arbeitsplatz im Mittel die Standardabweichung (SD) des Zeit-Konzentrations-Integrals (c x t-Produkt, die „Area under the Curve“, AUC) der mittleren endogenen Belastung in der erwachsenen Allgemeinbevölkerung nicht überschritten werden. Ein entsprechender Wert stellt die Akzeptanzkonzentration dar, sofern die auf Basis der krebserzeugenden Wirkstärke nach formalem Schema extrapolierte Konzentration zur Ausweisung einer niedrigeren Konzentration führen würde.
Expositionen gegenüber endogen gebildeten Kanzerogenen in Höhe der nach dem vorliegenden Leitfaden berechneten Akzeptanz- oder Toleranzkonzentrationen können zu Risiken führen, wie sie bereits durch die endogenen Belastungen der Stoffe vorliegen. Das Risiko durch die endogene Belastung kann sogar höher als etwa das so zugrundeliegende Akzeptanzrisiko sein. Die endogene Belastung ist daher bei der Vergleichsabschätzung zu beachten. In der Vergangenheit waren bereits für mehrere kanzerogene Stoffe endogene Belastungen ein Maßstab für eine entsprechende Bewertung von möglichen Arbeitsplatzexpositionen (Isopren, Ethanol und Acetaldehyd). Es ist in diesem Leitfaden noch nicht abschließend festgelegt, ob der resultierende Wert entsprechend der endogenen Belastung auf Akzeptanzniveau als AGW gelten kann.

6.4   Risikokonzentration als Schichtmittelwert und Expositionsspitzen oder verkürzte Expositionsdauer

(1) Die aus der Expositions-Risiko-Beziehung (ERB) abgeleiteten Konzentrationen21) stellen Schichtmittelwerte dar (Einheit: mg/m3, oder ppm). Diese dürfen für kurze Phasen innerhalb der Schicht überschritten werden (Kurzzeitwertphase), sofern der Schichtmittelwert eingehalten wird. Analog zu Stoffen mit nicht-kanzerogenen Wirkungen werden viermalig am Tag Überschreitungen des Schichtmittelwerts für jeweils bis zu 15 Minuten mit einem Überschreitungsfaktor vorgegeben. Der höchste Überschreitungsfaktor beträgt 8, da sonst das Produkt aus Schichtlänge und Grenzwert nicht mehr eingehalten werden kann.
(2) Für gentoxische Kanzerogene ist im Prinzip das Dosis-Zeit-Produkt (die AUC) entscheidend, da die Wahrscheinlichkeit eines DNA-Schadens von der Summe der über die Zeit einwirkenden reaktiven Metaboliten abhängt. Dadurch dass einer Konzentrationsspitze ein Zeitraum mit entsprechend verringerter Konzentration gegenüberstehen muss, um den Schichtmittelwert einzuhalten, ist im Prinzip gewährleistet, dass die tägliche Gesamt-Belastung von der Konzentrationsspitze unabhängig ist. Dies ist aber nur dann der Fall, wenn die Konzentrationsspitze so hoch ist, dass die detoxifizierenden Metabolismuswege noch einer linearen Kinetik gehorchen. Es muss also sichergestellt sein, dass bei der dem Überschreitungsfaktor entsprechenden Konzentration eine lineare Kinetik vorliegt, was z. B. anhand der Dosis-Häufigkeits-Beziehung oder aus entsprechenden Toxikokinetikstudien abgeschätzt werden kann. In den meisten Fällen dürfte dies aufgrund der relativ niedrigen dem Toleranzrisiko entsprechenden Konzentrationen der Fall sein, so dass sich häufig als ÜFkanz ein Wert von 8 ergibt.
(3) Nur in Ausnahmefällen kann die kurzzeitige Spitzenkonzentration bei Exposition gegenüber krebserzeugenden Stoffen über die Wirkstärke einer gentoxischen Wirkung nach kurzer Zeitdauer abgeleitet werden. Dies wäre ein möglicher Grund vom unter (2) formulierten Default abzuweichen und kann dann zu begründeten Abweichungen im ÜFkanz führen. Ein weiterer Grund für die Abweichung vom Defaultfaktor 8 ist das Vorliegen eines Verstärkereffekts. Auch hierbei wäre zu klären, ob für diesen Effekt primär die Konzentration allein oder das Konzentrations-Zeitprodukt (die AUC) wesentlich ist. Falls die AUC entscheidend ist, ist die Konzentrationsspitze irrelevant, es sei denn, die Kinetik ist in diesem Bereich nicht mehr linear (siehe (2)). Falls nicht eindeutig zu klären ist, ob die AUC entscheidend ist, sollte als Defaultannahme eine Konzentrationsabhängigkeit unterstellt werden und die Berechnung des ÜF erfolgt wie für die nichtkanzerogenen Wirkungen (siehe (4)).
Da die Akzeptanzkonzentration selbst bei Kanzerogenen mit Verstärkereffekten im Normalfall weniger als 1/10 der TKC beträgt, der höchste ÜF aber nur 8 sein kann, ist die Ausweisung eines ÜF für die Akzeptanzkonzentration (2018) nicht erforderlich.
(4) Überschreitungsfaktoren für nichtkanzerogene Wirkungen werden im Rahmen dieses Leitfadens nach der Methodik quantifiziert, wie sie von DFG für die Bestimmung von Kurzzeitwerten vorgesehen sind. Dabei wird zwischen lokal wirkenden (reizenden) und systemisch wirkenden Stoffen unterschieden.
(5) Es werden folgende Fälle unterschieden und folgende Regeln für die Bestimmung des ÜFkanz festgelegt:
Tabelle 2: Abfrage für die Auswahl eines Überschreitungsfaktors bei Kurzzeitexposition (Abweichung vom Tagesmittel) bei kanzerogenen Effekten in Verbindung mit möglichen nichtkanzerogenen Effekten
Wennund wennund wenndann
a.
TNKC ≥ TKC?
KZCnkanz
KZCkanz
 
–>
ÜFkanz maßgeblich
b. (b1)
TNKC ≥ TKC?
KZCnkanz <
KZCkanz
KZCnkanz wegen Reizwirkung:
–>
ÜF= KZCnkanz/TKC
c. (c1)
TNKC > TKC ?
KZCnkanz <
KZCkanz
KZCnkanz wegen systemischer Wirkung und KZCkanz/ KZCnkanz ≤ 2 :
–>
ÜFkanz maßgeblich
c. (c2)
TNKC > TKC ?
KZCnkanz < KZCkanz
KZCnkanz wegen systemischer Wirkung und KZCkanz/ KZCnkanz > 2
–>
ÜF= KZCnkanz/TKC
d.
TNKC = TKC ?
KZCnkanz < KZCkanz
KZCnkanz wegen systemischer Wirkung:
–>
ÜFnkanz maßgeblich
e.
TNKC < TKC ?
  
–> kein ÜFkanz auszuweisen; ÜFnkanz maßgeblich
f.
kein TNKC festgelegt?
  
–> ÜFkanz maßgeblich
Beispiel zu a:
TNKC: 2 ppmÜFnkanz 4KZCnkanz : 8 ppm 
TKC: 1 ppm
ÜFkanz 8
KZCkanz : 8 ppm
–> maßgeblicher ÜF = 8
Beispiel zu b1:
TNKC: 2 ppmÜFnkanz 1KZCnkanz : 2 ppm 
TKC: 1 ppm
ÜFkanz 8
KZCkanz : 8 ppm
–> maßgeblicher ÜF = 2
Beispiel zu c1:
TNKC: 2 ppmÜFnkanz 2KZCnkanz : 4 ppm 
TKC: 1 ppm
ÜFkanz 8
KZCkanz : 8 ppm
–> maßgeblicher ÜF = 8
Im Beispiel c1 ist am Arbeitsplatz die TKC von 1 ppm einzuhalten. Der maßgebliche EF beträgt 8, weil dadurch auch die aus der KZCkanz resultierende Konzentration im Blut für den nicht-kanzerogenen Effekt eingehalten ist: Bei einer Halbwertszeit von 1 Stunde (kürzestmögliche Halbwertszeit für ÜF 2) ist die Konzentrationsspitze 20 % höher als die Steady-State-Konzentration im Blut, bei einem ÜF von 8 ist sie 140 % höher als die Steady-State-Konzentration (DFG 201122)). Die Steady-State-Konzentration bei Exposition gegen TKC ist aber nur halb so hoch wie bei Exposition gegen TNKC. Cmax bei KZCkanz = (0,5 x steady-state TNKC) x 2,4 = 1,2 x steady-state TNKC, d. h. Cmax ist bei beiden Szenarien gleich hoch. Bei noch längeren Halbwertszeiten ist der Einfluss der Spitzenkonzentration noch geringer.
Beispiel zu c 2:
TNKC: 1,5 ppmÜFnkanz 2KZCnkanz : 3 ppm 
TKC: 1 ppm
ÜFkanz 8
KZCkanz : 8 ppm
–> maßgeblicher ÜF = 3
Im Beispiel c2 ist das Verhältnis von KZCkanz zu KZCnkanz zu groß als dass ÜFkanz ausreicht. Mit den Zahlen aus (DFG 2011:
http://onlinelibrary.wiley.com/doi/10.1002/3527600418.mbpeakexpd0051/pdf) würde ein ÜF 4 zur gleichen Cmax führen. Der Einfachheit halber wird als ÜF das Verhältnis KZCnkanz/TKC als maßgeblicher ÜF verwendet.
Beispiel zu d:
TNKC: 1 ppmÜFnkanz 2KZCnkanz : 2 ppm 
TKC: 1 ppm
ÜFkanz 8
KZCkanz : 8 ppm
–> maßgeblicher ÜF = 2
Falls ein ÜF von 8 angemessen ist, können stattdessen auch längere Überschreitungszeiträume als bis zu 15 Minuten mit dann entsprechend geringerem ÜF toleriert werden (z. B. bei 30 Minuten: ÜF 4 statt 8), solange das Produkt aus ÜF und Überschreitungsdauer weiter eingehalten wird.
Fußnote 21)
TKC: Toleranzkonzentration (basiert auf Krebsrisikoberechnung); TNKC: Toleranzkonzentration, (basiert auf nichtkanzerogener Wirkung / AGW-analogem Wert); AKC: Akzeptanzkonzentration; ÜFkanz Überschreitungsfaktor (englisch: EFcarc); KZCkanz resultierende Kurzzeitkonzentration für krebserzeugende Wirkung (englisch: STELcarc); ÜFnkanz: Überschreitungsfaktor für nichtkanzerogene Effekte (englisch: EFnoncarc); KZCnkanz resultierende Kurzzeitkonzentration für nichtkrebserzeugende Wirkung (engl.: STELnoncarc)

6.5   Simultane Exposition gegenüber mehreren Kanzerogenen

Zur Risikoquantifizierung bei kombinierter Einwirkung mehrerer krebserzeugender Stoffe am Arbeitsplatz liefert dieser Leitfaden derzeit keine Methodik.

7   Intraspeziesextrapolation

(1) Es wird keine Intraspeziesextrapolation durchgeführt. Der Maßstab ist demnach das durchschnittliche individuelle zusätzliche Lebens(arbeits)zeitrisiko. Das Risikomanagement legt dabei ein niedriges durchschnittliches Risiko als Maßstab zugrunde, wodurch auch das Risiko für empfindliche Personengruppen niedriger wird und diese Gruppe so indirekt berücksichtigt ist. Während bei Nichtkanzerogenen der (weitgehende) Schutz der Empfindlichen vor Gesundheitseffekten durch einen Intraspeziesfaktor explizit (als Defaultfaktor für Variabilitäten) erfolgt, wird im Rahmen dieses Leitfadens also dieser Schutz bei Kanzerogenen durch die Auswahl eines entsprechend niedrigeren (als akzeptabel oder tolerabel erachteten) durchschnittlichen individuellen Risikos vorgesehen. Könnte man einen geeigneten Intraspeziesfaktor für krebserzeugende Wirkung beziffern, wäre eine direkte Umrechnung (auf das Risiko für empfindliche Personengruppen) möglich.
Die Nichtberücksichtigung des Intraspeziesfaktors bei Kanzerogenen entspricht einer häufiger angewandten Konvention (ECHA, 2012b). Es liegen nur unzureichende Daten vor, die die Spannbreite der Empfindlichkeiten für das multifaktorielle Geschehen der Kanzerogenese hinreichend abbilden würden.
Es ist nicht erkennbar, dass für die Begründung eines wissenschaftlich gestützten Defaultwerts für diese Intraspeziesvariabilität hinreichende Daten aus dem Bereich krebserzeugender Wirkung in absehbarer Zeit vorliegen werden. Die Angabe der Höhe eines entsprechenden Faktors wäre aufgrund dieser ungenügenden Datenlage also äußerst unsicher. Eine vorläufige Auswertung tierexperimenteller Daten zeigte keine deutlich größere Variabilität von Auszuchtstämmen im Vergleich zu Inzuchtstämmen in Bezug auf das Krebsgeschehen. Eine einfache Verknüpfung von Enzymaktivitäten und deren Variabilität mit der Variabilität im Krebsgeschehen ist nicht möglich.
Einzelne Bewertungsmethoden (vgl. z. B. EFSA (2005), vgl. auch Abschnitt 1.4 (3)) weisen jedoch einen Intraspeziesfaktor von 10 auch für Kanzerogene aus, ohne dass sich dies bei diesem Vorschlag auf das Schutzniveau – Höhe des vorgesehenen Grenzwerts – auswirken würde. Bei EFSA (2005) wird unterstellt, dass die Intraspeziesvariabilität für krebserzeugende Effekte identisch mit derjenigen für andere Effekte sei.
Auch von der U.S.EPA (2005b) wird ein Intraspeziesfaktor für Krebs berücksichtigt, jedoch ausdrücklich nur für das Kleinkindalter, bei denen eine besondere Empfindlichkeit gezeigt ist, das in den tierexperimentellen Kanzerogenitätsstudien in der Regel aber nicht abgebildet wird. Das entsprechende Schutzgut kindliche Gesundheit ist in der vorliegenden Betrachtung nicht maßgeblich.
Für die Quantifizierung von nichtkanzerogenen Effekten, die als Auslöser oder Verstärker für Kanzerogenität berücksichtigt werden, werden jedoch empfindliche Personengruppen explizit berücksichtigt (vgl. Abschnitt 5.2 (2) und 5.3 (4)).

8   Mindestkriterien für eine Risikoquantifizierung

8.1   Einstufung der zu bewertenden Substanz

(1) In der Regel sind quantitative Abschätzungen der Expositions-Risiko-Beziehung für Kanzerogene vorzunehmen, die in die Kategorien 1A oder 1B für Kanzerogenität gemäß CLP-Verordnung (EG) Nr. 1272/2008 eingestuft sind.
Ob auch krebserzeugende Substanzen ohne formale Einstufung (EU) nach ERB-Kriterien bewertet werden, wird im Einzelfall entschieden. Diese Überlegung ist z. B. für von IARC oder U.S.EPA oder nationalen Gremien eingestufte oder zur Einstufung empfohlene Stoffe relevant. Die Frage einer Überprüfung der Einstufungen ist nicht Gegenstand dieses Leitfadens. Für einen Stoff ohne Legaleinstufung (EU) kann eine ERB jedoch nur dann ausschlaggebend für die regulatorische Handhabung sein, wenn er zugleich als eindeutiges Kanzerogen in der TRGS 905 eingestuft ist. Anderenfalls dient die ERB-Betrachtung nur Vergleichszwecken, um das Krebsrisiko gegenüber nichtkanzerogenen Wirkungen einordnen zu können.
(2) Zusätzlich sind nach einer Einzelfallabwägung auch Substanzen bewertbar, die in die Kanzerogenitätskategorie 2 (Verordnung (EG) Nr. 1272/2008) eingestuft sind. Dies gilt insbesondere, wenn diese Einstufung nicht durch die (limitierte) Qualität der Studie oder deren (unzureichende) Berichterstattung und nicht durch die fragliche Humanrelevanz begründet wurde, sondern mechanistische Unsicherheiten im Vordergrund standen (z. B. möglicher Schwellenmechanismus, fragliche Gentoxizität bei sonst eindeutiger Befundlage zum kanzerogenen Geschehen).
Für einen Krebsverdachtsstoff (Kategorie 2 nach CLP-Verordnung) kann eine ERB jedoch nur dann ausschlaggebend für die regulatorische Handhabung sein, wenn er zugleich als eindeutiges Kanzerogen in der TRGS 905 eingestuft ist. Anderenfalls dient die ERB-Betrachtung nur Vergleichszwecken, um das mögliche Krebsrisiko gegenüber nichtkanzerogenen Wirkungen einordnen zu können.
Ob auch „krebsverdächtige“ Substanzen ohne formale Einstufung (EU) zu Vergleichszwecken nach ERB-Kriterien bewertet werden, wird durch Einzelfallentscheidung festgelegt. Die Frage einer Überprüfung der Einstufungen ist nicht Gegenstand dieses Leitfadens.
(3) Kanzerogene, die nach dem nationalen Bewertungsvorschlag der MAK-Kommission in Kategorie 4 oder 5 eingestuft wurden (DFG, 2012), sind in der Regel einer quantitativen Risikoabschätzung zugänglich.
Eine ERB kann jedoch auch hier nur dann ausschlaggebend für die regulatorische Handhabung sein, wenn der Stoff zugleich als eindeutiges Kanzerogen in der TRGS 905 eingestuft ist.

8.2   Information zur Kanzerogenität bei inhalativer Exposition

Tumorigenitätsdaten zum Inhalationspfad sind für eine Ableitung einer Expositions-Risiko-Beziehung am Arbeitsplatz erforderlich; dazu zählen auch Daten, die über Pfad-zu-Pfad-Extrapolationen abschätzbar sind (vgl. Abschnitt 4.4). Liegen Krebsinzidenzen z. B. nur nach oraler, dermaler oder parenteraler Applikation vor, ohne dass eine qualifizierte Pfad-zu-Pfad-Extrapolation möglich wäre, kann keine entsprechende Quantifizierung vorgenommen werden.

8.3   Tumorlokalisationen ohne oder mit eingeschränkter quantitativer Übertragbarkeit

Soweit bestimmte Tumorlokalisationen bei bestimmten Tierspezies auftreten (ggf. auch geschlechtsgebunden oder in Verbindung mit anderen Stoffeigenschaften) gelten diese Befunde als nicht oder nicht quantitativ übertragbar. Die entsprechenden Einschränkungen sind bei der Prüfung der Mindestkriterien zu beachten (vgl. Abschnitt 3.1 (6)).
Folgende Tumorformen bei Nagetieren sind Beispiele für eine (häufig oder manchmal) fehlende oder eingeschränkte quantitative Übertragbarkeit auf den Menschen:
  • Nierentumoren nach α-2u-Globulin-induzierter Nephropathie der männlichen Ratte
    Nierentumoren nach α-2u-Globulin-induzierter Nephropathie der männlichen Ratte sind ein spezies- und geschlechtsspezifisches Phänomen und können durch eine Vielfalt nicht-gentoxischer, jedoch an dieses Protein bindende Chemikalien ausgelöst werden.
    Dieser Effekt hat keine Relevanz für den Menschen (Capen et al., 1999).
  • Lebertumoren nach PPARα-Stimulation („Peroxisomenproliferation“)
    Diese Tumoren sind in hohem Maße nagerspezifisch. Durch Stimulation des Peroxisomenproliferator-aktivierenden Rezeptors α (PPARα) – überwiegend in den Leber-Peroxisomen lokalisiert – wird bei manchen Tierarten, insbesondere Ratte und Maus ein komplexes Enzymmuster induziert, welches als ein zweiter Pfad für Fettsäurekatabolismus wirkt. Die Folgen sind u. a. oxidativer Stress, starke Vermehrung der Peroxisomen, Organhyperplasie, gesteigerte, z. T. auch anhaltende Zellproliferation. Auch Lebertumoren können sich entwickeln. Die menschliche Leber bildet diesen Rezeptor nur in geringem Maße. Viele Tierarten, darunter auch Rezeptor-defiziente transgene Mäuse, zeigen nicht das Phänomen der Peroxisomenproliferation. Eine Relevanz für den Menschen ist in den meisten Fällen nicht gegeben (IARC, 2000)
  • Leukämien der Fischer-Ratte
    Mononukleäre (large granular lymphocyte; LGL) Leukämien sind sehr häufig in Fischer-Ratten. Ihre Entwicklungen beginnen in der Milz und zeigen stark schwankende Inzidenzen (ca. 15–25 %, in kleineren Kollektiven von 50 Tieren auch bis 50 %). In ihre Bewertung sind die historischen Kontrolldaten mit einzubeziehen. Das alleinige Auftreten dieses Tumors reicht in der Regel nicht aus, um eine Testsubstanz als krebserzeugend zu bewerten. Bei einer gentoxischen Substanz kann allerdings eine Humanrelevanz nicht grundsätzlich ausgeschlossen werden. In diesen Fällen wäre zu prüfen, ob Mononukleäre Leukämien die einzige vermehrte Tumorform war, mit der eine quantitative Risikoabschätzung durchgeführt werden kann.
  • Phäochromocytome der Fischer-Ratte
    Phäochromocytome sind benigne oder maligne Tumoren, die meist aus den chromaffinen Zellen des Nierenmarks entstehen, aber auch ektopisch vorkommen können (Paraganglien, entwicklungsgeschichtlich verstreute Epithelkeime?). Im Menschen, in dem diese Tumoren selten sind, kommt es leicht zur Freisetzung von Katecholaminen und damit zu Blutdruckkrisen und anderen metabolischen und kardiovaskulären Ereignissen. In der Ratte sind diese Tumoren, sowohl spontan als auch expositionsbedingt, relativ häufig. Bei einer quantitativen Risikoabschätzung sind mittlere historische Raten und Schwankungsbreiten einzubeziehen, auch ist diagnostisch abzugrenzen von (häufig altersbedingten) Hyperplasien. Männliche Ratten sind offenbar gegenüber diesem Tumor eher disponiert als weibliche Ratten. Nach einer Analyse von Greim et al. (2009) wirken metabolische Alterationen wie Hypoxie, Störungen der Sauerstoff-Utilisation, der Ca-Homöostase oder der hypothalamischen endokrinen Regulation auslösend oder verstärkend. Diese Zustände können im Tierexperiment durch die Testsubstanz bedingt sein, in den meisten Fällen sind es aber Hochdosisphänomene mit eingeschränkter Relevanz für Arbeitsplatzexpositionen. Dies gilt besonders bei nicht-gentoxischem Wirkmechanismus und ausschließlicher Betroffenheit des männlichen Geschlechtes.
  • Schilddrüsentumoren bei der Ratte
    Stoffe, welchen den Glucuronidierungspfad (Phase-II-Enzyme) in der Leber induzieren, können auch zu einer rascheren Elimination von Schilddrüsenhormonen aus dem Blut führen und in der Folge über den zentralen Regelkreis zu einer Stimulation des Schilddrüsengewebes (Goldstein und Taurog, 1968; Hill et al., 1989; McClain, 1989). Leberhypertrophie oder andere Anzeichen einer generellen Enzyminduktion sind dabei nicht immer zu beobachten. Dies zeigt das Beispiel tert-Butanol (NTP, 1995), welches bei Mäusen beiderlei Geschlechts zu Schilddrüsenhyperplasien führte und bei den weiblichen Tieren vermehrt zu Adenomen der Schilddrüse. Beim Kaninchen wurde eine partielle Glucuronidierung dieses Stoffes nachgewiesen (Kamil et al., 1953).
    Beim Menschen wird in der Regel der Glucuronidierungspfad weniger in Anspruch genommen als bei der Ratte. Außerdem sind beim Menschen Triiodthyronin (T3) und Thyroxin (Tetraiodthyronin; T4) im Plasma hochaffin an ein Transport-Protein gebunden und haben wesentlich längere Halbwertzeiten als bei der Ratte (Döhler et al., 1979; Larsen, 1982; Oppenheimer, 1979). Somit fällt für den T3/T4-Stoffwechsel des Menschen ein erhöhtes Angebot glucuronidierender Enzyme weniger ins Gewicht. Das Serum-TSH ist ferner bei der männlichen Ratte wesentlich höher konzentriert als bei der weiblichen Ratte und um ein Vielfaches höher als beim Menschen, der im Übrigen auch nicht den Geschlechtsunterschied in den TSH-Spiegeln aufweist (Chen, 1984). Die männliche Ratte ist typischerweise für benigne und maligne Schilddrüsentumoren disponiert, während beim Menschen auch bei hoher TSH-Stimulation Schilddrüsenkarzinome nicht beobachtet werden (Refetoff et al., 1993). Aus all diesen Daten wird gefolgert, dass in der Ratte nicht-gentoxisch und über diesen Mechanismus induzierte Schilddrüsenkarzinome für den Menschen von eingeschränkter Relevanz sind (Capen et al., 1999).
  • Leydigzelltumoren
    Leydigzelltumoren sind bei Nagern sehr viel häufiger als beim Menschen. Das Adenom aus den Zellen des Interstitiums ist der häufigste Tumor bei der Ratte überhaupt; die Spontaninzidenz bei Fischer Ratten kann bis nahezu 100 % gehen; bei Long Evans Ratten ca. 1–2 % (McConnell et al., 1992). Die Relevanz dieser Tumoren für den Menschen ist gering, insbesondere, wenn ein Stoff nicht gentoxisch ist (Cook et al., 1999).
  • Lebertumoren der B6C3F1-Maus
    Diese Tumoren haben eine hohe Hintergrundrate. Nach Maronpot (1999) treten Leberadenome bei ca. 30 % der Zeichen für männlich: Tiere und bei 15 % der Zeichen für weiblich Tiere auf; hepatozellulare Karzinome bei 20 % der Zeichen für männlich und bei 10 % der Zeichen für weiblich Tiere. Insbesondere wenn eine Substanz nicht gentoxisch ist und diese Tumorart als einzige vermehrt auftritt, bestehen Zweifel, ob die Kriterien erfüllt sind, um die Substanz als krebserzeugend für den Menschen zu bewerten (Gamer et al., 2002). Auch die absolute Höhe der Dosis und der Zufuhrmodus (Schlundsonde?) sind in die Überlegung der Relevanz der Lebertumoren der B6C3F1-Maus für den Menschen mit einzubeziehen.
  • Vormagentumoren
    Bei diesen Tumoren ist die Relevanz für den Menschen wegen der anderen anatomischen Verhältnisse u. U. stark eingeschränkt, insbesondere wenn es sich um nicht-gentoxische Substanzen handelt. Bei gentoxischen Substanzen ist ihre Eignung als Grundlage einer quantitativen Risikoerrechnung von Fall zu Fall zu entscheiden und hängt auch davon ab, ob noch andere Gewebe betroffen sind. Auch das lokale Reizpotential und der Zufuhrmodus (Fütterung vs. Sondierung) sind bei der Bewertung einzubeziehen. Bei Inhalationsstudien ist zu prüfen, ob die Substanz nach Kondensation auf dem Fell der Tiere bei der Fellpflege (Einzeltierhaltung oder Gruppenexposition in Kammern?) auch oral aufgenommen werden konnte.
  • Mesotheliome der Tunica albuginea bzw. Tunica vaginalis (männliche Ratten)
    Es handelt sich um Tumoren, die in seltenen Fällen auch beim Menschen vorkommen. Bei Ratten besteht zeitlebens eine offene Verbindung zwischen Hodensack und Bauchhöhle, so dass der von der Tunica albuginea und dem Peritonealmesothel überzogene Hoden durch den mit Peritonealmesothel ausgekleideten Leistenkanal in die Bauchhöhle hinein und wieder heraus migrieren kann. Bei manchen Rattenstämmen, besonders bei Fischer-Ratten (McConnell et al., 1992; Mitsumori und Elwell, 1988), treten hier relativ häufig Mesotheliome auf. Wenn eine Substanz gentoxisch ist, kann eine Humanrelevanz aber nicht grundsätzlich verneint werden, nur weil beim Menschen andere anatomische Verhältnisse herrschen.
    Beispiele:
    Ethylenoxid (EO) ist ein Mutagen und verteilt sich ziemlich gleichmäßig im Körper. EO hat zu Mesotheliomen der Tunica albuginea der männlichen Ratte geführt. Da aber zugleich (und mit ähnlicher Benchmarkdosis) auch andere Tumoren vermehrt auftraten, wurden diese zur Risikoquantifizierung herangezogen. Acrylamid (Trinkwasserstudie) ist ein weiteres Beispiel für diese Mesotheliome der Tunica albuginea (IARC, 1994).
  • Harder´sche Drüsen (Augenwinkel) und Zymbaldrüsen (Ohrtalgdrüse)
    Diese Drüsen kommen beim Menschen zwar nicht vor, eine expositionsbedingte Vermehrung von Tumoren in diesen Drüsen von Versuchstieren ist jedoch für eine quantitative Risikoabschätzung aufzugreifen, es sei denn, andere Tumoren sind besser geeignet.
    Beispiel:
    Dichlorbenzidin hat in zwei Untersuchungen zu Zymbaldrüsenkarzinomen geführt (Pliss, 1959; Stula et al., 1975). Auch andere Tumorarten wurden beobachtet, darunter Harnblasentumoren und Adenokarzinome der Mamma an männlichen Tieren. Die Inzidenz der Zymbaldrüsentumoren war jedoch am höchsten, so dass diese bei einer quantitativen Risikoabschätzung herangezogen werden könnten.

8.4   Fehlende Studien

Liegen keine tierexperimentellen Langzeitstudien und keine qualifizierten Humanstudien zu einer Substanz vor, ist in der Regel keine Quantifizierung des nominellen Krebsrisikos möglich. In Einzelfällen kann aufgrund von Analogiebetrachtungen und eingeschränkten substanzspezifischen Studien eine Quantifizierung gerechtfertigt sein. Dann gehören zu den für diese Abschätzung regelmäßig erforderlichen Studien auch Nachweise einer vergleichbaren Gentoxizität. Hierzu sind entsprechende Begründungen vorzulegen.

8.5   Qualität der tierexperimentellen Studie und der Berichterstattung

(1) Es wird in der Regel eine Veröffentlichung mit detaillierter Berichterstattung vorausgesetzt. Es sollten genannt sein: Spezies, Stamm und Geschlecht der exponierten Tiere und der Kontrolle, Anzahl der exponierten Tiere/Expositionsgruppe/Geschlecht inkl. Kontrolle, Dosierungen oder Luftkonzentration und analytische Nachweismethode für die Expositionsangabe, Gewicht der Tiere zu Beginn und am Ende der Exposition/Vergleich zwischen Expositionsgruppen und Kontrolle, Expositionsdauer und Nachbeobachtungsdauer, Tumorinzidenzen/Gruppe inkl. Kontrolle und ggf. historische Kontrolldaten, Nachweismethode und Untersuchungsumfang zur Feststellung der Tumorinzidenzen, Mortalität während des Versuchs und bei Versuchsende, begleitende nichtbösartige Effekte (Kontrolle, Dosisgruppen) inkl. der expositionsbedingten und nicht-expositionsbedingten Effekte, Veränderung der Organgewichte (relativ und absolut), Besonderheiten in der Nahrungszusammensetzung und in der Nahrungsaufnahme, Identität der Substanz inkl. Angabe zur Reinheit oder Angaben zu Verunreinigungen und Additiven.
Es sollte die Körpergewichtsentwicklung nicht um 10 % oder mehr reduziert sein und die Lebenserwartung der Tiere sollte nicht durch andere Ursachen als Tumorbildung deutlich verringert sein, d. h. die maximal tolerierbare Dosis (MTD) sollte nicht überschritten sein.
Werden diese Qualitätskriterien in einer Studie oder in der Berichterstattung zu einer Studie nicht erfüllt, so ist in der Regel keine quantitative Abschätzung des Lebenszeitrisikos auf Basis der entsprechenden Einzelstudie möglich.
In Versuchsgruppen mit stark erhöhter Tumorhäufigkeit ist auch mit sonstiger Substanztoxizität zu rechnen. Diese stünde in der Regel einer Einbeziehung der Gruppe in die Analyse der Expositions-Risiko-Beziehung nicht entgegen.
Die hier beschriebenen Mindestkriterien betreffen Kriterien, die beim Tierexperiment mindestens für eine Risikoquantifizierung erfüllt sein sollten, betreffen jedoch nicht notwendigerweise Kriterien, die für eine Entscheidung bei der Einstufung erfüllt sein sollten.
(2) Sind für eine tierexperimentelle Studie die Mindestkriterien nach 8.5 (1) nicht erfüllt, so ist ersatzweise zu prüfen, ob durch Zusammenschau mehrerer Studien eine „weight of evidence“-Betrachtung möglich ist (vgl. Abschnitt 8.7).

8.6   Mindestkriterien zur Berücksichtigung von epidemiologischen Studien bei der Risikoableitung

Mindestkriterien im vorliegenden Zusammenhang betreffen Kriterien, die mindestens für eine Risikoquantifizierung erfüllt sein sollten, nicht jedoch notwendigerweise Kriterien, die für eine Entscheidung bei der Einstufung erfüllt sein sollten.
(1) Zentrale Anforderungen an epidemiologischen Studien („Mindestkriterien“) sind:
  • vor Studienbeginn formulierte Studienhypothese/Fragestellung,
  • der Fragestellung/dem nachzuweisenden Risiko angemessener Studienumfang (statistische Power),
  • adäquate diagnostische Qualität und Dokumentation oder – bei Zugriff auf Krebsregister – adäquate Qualität des Registers und soweit mögliche Charakterisierung von Tumorlokalisation und -typ (ICD),
  • Berücksichtigung von Störfaktoren (Confoundern),
  • Vermeidung von Selektionseffekten (Bias) und kritische Diskussion ihrer möglichen Auswirkungen auf die Studienergebnisse
  • Informationen, die eine kritische Bewertung der Studienergebnisse erlauben, z. B. der Konsistenz von Dosis-Wirkungsbeziehungen oder der Robustheit der Ergebnisse (Sensitivitätsanalysen, z. B. durch Ausschluss bestimmter Subgruppen, stratifiziert nach Beschäftigungsdauer, Expositionsintensität etc.).
    Aufgrund der kollektiven Expositionszuschreibung sollten Korrelationsstudien für eine Bewertung a priori nicht berücksichtigt werden. Auch Fallstudien ohne Vergleichsgruppe sind für eine Risikoableitung ungeeignet. Querschnittsstudien sind aufgrund des fehlenden Zeitbezugs nur zur Bewertung akuter Effekte geeignet (Monitoring-Studien mit individueller Expositionseinstufung); ohne Bezug auf einen relevanten Endpunkt sind sie für die Bewertung eines Krebsrisikos nicht geeignet.
    Die Deutsche Gesellschaft für Epidemiologie hat Leitlinien für Gute Epidemio-logische Praxis (GEP) entwickelt, die einen Qualitätsstandard für die epidemiologische Forschung in Deutschland etablieren und helfen sollen, Unredlichkeit und wissenschaftliche Fälschung zu vermeiden und einen vertrauensvollen Umgang unter Wissenschaftlern zu gewährleisten (http://www.dgepi.de/infoboard/stellungnahmen.htm). Die genannten zentralen Anforderungen an epidemiologische Studien sind diesen Leitlinien entnommen.
(2) Die Expositionsabschätzung sollte Informationen für folgende Aspekte beinhalten:
  • Zu Methode und der Datenquellen der Expositionsabschätzung
  • Zu den vorab formulierte Bewertungsregeln für die Expositionsermittlung
  • Angaben zur kumulativen Exposition oder für ihre Berechnung, d. h. Angabe der Dauer und Intensität der Exposition
  • Angaben zur Berücksichtigung von Ko-Expositionen: Im Unterschied zum Experiment treten oft Mischexpositionen auf, die die Zuordnung des Erkrankungsrisikos zu einem speziellen Agens erschweren. Daher müssen in Frage kommende Ko-Expositionen in Betracht gezogen werden.
  • Berücksichtigung weiterer Expositionspfade, z. B. dermale Stoffaufnahme bei hautresorptiven Stoffen.
    Sofern diese Aspekte in einer Studie nicht hinreichend berücksichtigt sind, erfüllt sie nicht die erforderlichen Mindestkriterien für ihre Verwendung für die Risikoquantifizierung.
    Literatur: Cordier und Stewart (2005); Ahrens und Stewart (2003); Kromhout (1994); Lavelle et al. (2012)
    Humandaten, die den o. g. Anforderungen genügen, liegen nur für relativ wenige Substanzen vor. Deshalb sollte im Einzelfall geprüft werden, ob epidemiologische Studien schwächerer Qualität vorliegen, die zwar allein nicht ihre Verwendung für die Ableitung von Dosis-Wirkungs-Beziehungen rechtfertigen, wohl aber bei Konsistenz mit anderen Daten – aus ebenfalls schwächeren Humanstudien oder aus Tierexperimenten – mit denen sich z. B. bei einer bestimmten Exposition Risiken in ähnlicher Größenordnung abschätzen lassen („Weight of Evidence“-Betrachtung, vgl. Abschnitt 8.7).
    Die Ermittlung und Bewertung von beruflichen Expositionen („Exposure Assessment“) erfolgt insbesondere in der Krebsepidemiologie oftmals retrospektiv. Dies birgt die Gefahr einer Fehlklassifikation der Exposition. Verschiedene Methoden zum „Exposure Assessment“ wurden entwickelt, um eine möglichst valide Einschätzung der beruflichen Expositionen zu ermöglichen. Unabhängig von möglichen Kombinationen und weiteren Informationsquellen beruhen Expositionsermittlungen und -bewertungen im Rahmen arbeitsplatzepidemiologischer Studien auf Messdaten, Experteneinschätzungen, Expositionseinstufungen durch „Job-Exposure-Matrizen“ (JEM) oder Selbstangaben der Studienteilnehmer und Teilnehmerinnen. Alle Methoden des „Exposure Assessments“ weisen spezifische Stärken und Schwächen auf. Bei der Ableitung von Expositions-Risiko-Beziehungen können davon unabhängig grundsätzlich alle Methoden berücksichtigt werden, sofern sie die Einschätzung der kumulativen Exposition mit ausreichender Sicherheit erlauben.
    Für weitere Details zu den besonderen Stärken und Schwächen der Studiendesigns siehe Ahrens et al. (2008).

8.7   „Weight-of-Evidence“-Betrachtung und deren Grenzen

(1) In manchen Fällen kann bei fehlender Mindestqualität einer Einzelstudie diese durch eine „weight of evidence“-Betrachtung von mehreren Humanstudien, mehreren Versuchstierstudien oder ihrer Kombination ersetzt werden (auch wenn jede für sich die Mindestqualitätskriterien nicht erfüllt). Dabei könnten ggfs. auch In-vitro-Daten und Analogiebetrachtungen sowie mechanistische Studien einbezogen werden, sofern diese quantitative Schlussfolgerungen ermöglichen. Eine solche „weight of evidence“-Betrachtung ist anzustreben und einem Verzicht auf eine ERB-Ableitung vorzuziehen, sofern die Einzelfallabwägung hinreichend begründet ist. Zentrales Kriterium dabei ist, ob sich ein POD („point of departure“) mit hinreichender Sicherheit quantifizieren lässt.
Sofern auf Basis eines „weight-of-evidence“ eine Risikoquantifizierung erfolgt, ist zu erläutern:
  • In welchen Aspekten die „Mindestkritierien“ bei den zentral berücksichtigten Studien nicht erfüllt sind;
  • welche Unsicherheiten mit der Verwendung der aggregierten Daten auftreten;
  • welche quantitative Spanne, sofern hinreichend eingrenzbar, sich aus den möglichen Risikoquantifizierungen (Spanne möglicher POD) ergeben;
  • welche stützenden, positiven Begründungen die „weight of evidence“-Betrachtung quantitativ möglich machten;
  • was die Prinzipen der Zusammenführung der Daten zur Ausweisung eines POD (z. B. „geometrischer Mittelwert“, „gewichteter Mittelwert über Experteneinschätzung“, etc.) waren. Grundsätzlich soll die Aggregation der Daten einer Schätzung des „wahrscheinlichsten“ Wertes entsprechen („Maximum Likelihood“), nicht dem „reasonable worst case“ oder „worst case“.
    Wenn ein POD bestimmt werden kann, so ist in der Regel auch eine Extrapolation z. B. zum Akzeptanzrisiko möglich. Der Fall, dass die Mindestkriterien oder eine „weight of evidence“-Betrachtung zwar für die Ausweisung eines Toleranzrisikos ausreichen, jedoch nicht für die Ausweisung eines Akzeptanzrisikos, ist ausgeschlossen: die (lineare oder nichtlineare) Extrapolation in den Risikobereich < 4:1.000 (i.e.: 4:10.000 bis 4:100.000) ist bei allen Substanzen mit hohen Unsicherheiten verbunden und wurde als – die rein wissenschaftlichen Möglichkeiten überschreitende – Konvention unabhängig von der stoffspezifischen Datenlage konsentiert. Weitergehend wurde das oft konservativere Verfahren der linearen Extrapolation für Kanzerogene festgelegt, für die keine Informationen zum Wirkmechanismus vorliegen oder derartige Informationen nicht quantifizierbar sind; also für Stoffe mit besonders schlechter Datenlage.
    Es ist in der Regel davon auszugehen, dass im Extrapolationsbereich zwischen Toleranzkonzentration und Akzeptanzkonzentration keine (qualifizierten) Beobachtungsdaten vorliegen und somit regelmäßig Unsicherheit in der Extrapolation liegen. Mit dem o. g. Konventionscharakter betrifft die Frage der Mindestkriterien aber nur die Thematik eines quantitativen „point of departure“ (POD) und, ob er ohne übermäßig spekulativen Charakter ermittelt werden kann.
    Bei einer „weight of evidence“-Betrachtung ist zu berücksichtigen, dass bei vielen Stoffen die Anzahl der vorliegenden experimentellen Studien, epidemiologischen Daten und In-vitro-Daten sowie mechanistischer Erkenntnisse so gering ist, dass kein Zweifel über die Datenqualität aufkommt und somit (gestützt durch eine vordergründige Homogenität der wenigen Daten) die Mindestqualität als gegeben angesehen wird, obwohl bei zusätzlichen Analysen ebenfalls mit Diskrepanzen und konkretisierten Unsicherheiten zu rechnen wäre. Diesem Bias ist Rechnung zu tragen. Insofern sollten konkretisierte begrenzte Widersprüche oder Schwachpunkte einer Studie nicht dazu führen, dass eine ERB-Ableitung unterbleibt, während sie bei nicht konkretisierten Widersprüchen (üblicher Fall) erfolgt. Resultierende Unsicherheiten sind jedoch zu dokumentieren.
    Ergibt sich aus einer Datenanalyse und -abwägung, dass die Mindestkriterien nicht erfüllt sind und auch eine „weight of evidence“-Betrachtung keine ERB-Quantifizierung zulässt, so folgt daraus bei Stoffen der Kategorie 1A und 1B gemäß Verordnung (EG) Nr. 1272/2008 zwingend, dass insbesondere kein Schwellenwert für die Kanzerogenität (oder auch AGW) ermittelt werden kann, da die Ermittlung eines Schwellenwerts eine Datenqualität noch oberhalb der Mindestkriterien erfordert. Eine „Knickfunktion“ kann ggfs. im Rahmen einer „weight of evidence“-Betrachtung begründet werden.
(2) Eine weitergehende Abgrenzung zwischen „‘weight of evidence‘-Bewertung möglich“ und „keine quantitative Bewertung möglich“ ist am Einzelfall zu entscheiden und jeweils zu begründen. Als Kriterien für eine insgesamt ausreichende Qualität eines POD sind zu prüfen und zu bewerten:
  • Heterogenität der Befunde in den Einzelstudien (Ergebnisspanne, Größe der „Datenwolke“),
  • Risikohöhe im beobachteten Bereich (beim POD) im Vergleich zum Risiko 4:1.000,
  • Konsistenz von Tier- und Humanbefunden.
(3) Sind bei krebserzeugenden Substanzen weder für die Epidemiologie noch für die Tierversuche die Mindestkriterien erfüllt und kann auch keine „weight of evidence“-Betrachtung durchgeführt werden, ist keine ERB-Ableitung möglich (kein POD – keine ERB).
Es ist möglich, dass auch bei Kanz.-Kat.-1A-Stoffen (CLP-Verordnung) die Mindestkriterien nicht erfüllt sind, da diese die Risikoquantifizierung betreffen und nicht die Einstufung.
Die mangelhafte Datenlage, die es unmöglich macht, eine ERB abzuleiten, ist zu dokumentieren.
Es ist zu prüfen, ob auf Basis der nichtkanzerogenen Effekte die Ableitung eines AGW-analogen Wertes (oder eines AGW bei Krebsverdachtsstoffen) möglich ist. Ein solcher Wert ist im Rahmen der Berichterstattung (im Bezug zur nicht quantifizierbaren krebserzeugenden/möglicherweise krebserzeugenden Wirkung) einzuordnen.
(4) Reicht die Datenlage nicht für eine „weight of evidence“-Bewertung, ist nach Möglichkeit eine halbquantitative Aussage zum Krebsrisiko zu treffen.
Die mangelhafte Datenlage, die es nur ermöglicht, eine halbquantitative Risikoabschätzung vorzunehmen, ist zu dokumentieren und auf die relevante Unsicherheit der halbquantitativen Risikoabschätzung zu verweisen. Das Bewertungsergebnis kann jedoch auch lauten, dass keine (auch keine halbquantitative) Aussage zum Krebsrisiko möglich ist.
Es ist zu prüfen, ob auf Basis der nichtkanzerogenen Effekte die Ableitung eines AGW-analogen Wertes (oder eines AGW bei Krebsverdachtsstoffen) möglich ist. Ein solcher Wert ist im Rahmen der Berichterstattung (im Bezug zur nicht oder zur nur halb quantifizierbaren krebserzeugenden/möglicherweise krebserzeugenden Wirkung) einzuordnen.
(5) Sind die Mindestkriterien für den Tierversuch zwar erfüllt, jedoch nicht für Humandaten, und ist aus den unzureichenden Humandaten eine höhere Empfindlichkeit des Menschen im Vergleich zum Versuchstier zu vermuten, ist keine ERB-Ableitung möglich.
Es gelten die unter (1)–(4) gelisteten Anmerkungen zu einer „weight of evidence“- Betrachtung und der erforderlichen Kommentierung sowie zur Bewertung der nichtkanzerogenen Effekte.
Als Beispiel wird die Substanz o-Toluidin angeführt, bei der keine ausreichenden Humandaten für eine Risikoquantifizierung vorliegen, jedoch Hinweise darauf bestehen, dass ein beträchtliches Krebsrisiko für den Menschen vorliegen könnte. Ergebnisse aus qualifizierten Tierexperimenten ergeben ein geringes Krebsrisiko, das jedoch die quantitativen Hinweise aus den Humandaten nicht gänzlich erklärt. Es ist somit keine ERB-Ableitung möglich.
(6) Sind die Mindestkriterien beim Tierversuch erfüllt, jedoch nicht bei den Humandaten, und ist aus den unzureichenden Humandaten keine höhere Empfindlichkeit des Menschen im Vergleich zum Versuchstier abzuleiten (sowie bei gänzlich fehlenden Humandaten), ist eine ERB-Ableitung möglich.
Dies gilt grundsätzlich für Kanzerogene der Kategorie 1A, 1B und der Kategorie 2 (CLP-Verordnung). Es handelt sich hier um eine häufig anzutreffende Datenlage. Eine regulatorisch maßgebliche Verwendung der ERB setzt bei Stoffen der Kategorie 2 (Verdachtsstoffe) jedoch voraus, dass eine Einstufung nach TRGS 905 erfolgt (vgl. Abschnitt 8.1 (1)).
Die Möglichkeit einer ERB-Ableitung schließt grundsätzlich bei ausreichender Datenqualität bei Kat.-1A,1B-Stoffen (CLP-Verordnung) die Abschätzung einer anzunehmenden Schwelle für kanzerogene Effekte mit der Folge der Ausweisung eines AGW (Basis Kanzerogenität) ein.
(7) Sind bei Kanzerogenen der Kategorie-2 (CLP-Verordnung) die Mindestkriterien für die Bewertung der kanzerogenen Wirkstärke erfüllt, ist ein auf Basis der nichtkanzerogenen Effekte abgeleiteter gesundheitsbasierter AGW (statt Toleranz- und Akzeptanzwert auf Basis krebserzeugender Wirkung) dann als unsicher einzuordnen, wenn bei einer Exposition in Höhe des vorgesehenen AGW das für ihn mit der ERB-Methode kalkulierte Krebsrisiko größer ist als ca. 4:10.000.
In diesem Fall ist anzunehmen, dass es sich zwar „nur“ um einen Verdachtsstoff für kanzerogene Wirkung handelt, dass jedoch a) eine qualifizierte Aussage zum Krebsrisiko möglich ist, und b) dass dieses in Höhe des AGW noch relevant sein könnte, so dass eine isolierte Bewertung der nichtkanzerogenen Effekte angesichts des errechneten (möglichen) Krebsrisikos nicht zufriedenstellend ist. Der Vergleich zwischen den nach der ERB-Methode ermittelten Risiken bei der Toleranz- und Akzeptanzkonzentration und beim vorgesehenen AGW auf Basis nichtkanzerogener Effekte ist zu dokumentieren. Aufgrund der rechtlichen Situation ist die Bewertung der nichtkanzerogenen Wirkung maßgeblich.
Sofern eine Risikoabschätzung zu anderen krebserzeugenden oder krebsverdächtigen Substanzen erfolgt, die derzeit nicht nach CLP-Verordnung eingestuft sind (z. B. nur von U.S.EPA oder von IARC oder national außerhalb der TRGS 905 eingestufte Stoffe), ist die Situation ähnlich einzuschätzen.
(8) Sind für Kanzerogene der Kategorie 1A und 1B (CLP-Verordnung) die Mindestkriterien bei den Humandaten erfüllt, jedoch nicht bei den tierexperimentellen Daten, so ist eine ERB-Ableitung möglich.
Es ist eher zu erwarten, dass bei Stoffen, die nach Kategorie 1A eingestuft sind, die Mindestkriterien bei den Humandaten erfüllt sind, während dies bei Stoffen, die nach Kategorie 1B eingestuft sind, unwahrscheinlich ist. Diese Zuordnung ist jedoch nicht abgesichert, da die Einstufungskriterien nicht identisch zu den Kriterien bei der quantitativen Risikobewertung sind.
(9) Sind sowohl bei Tierexperiment wie bei den Humandaten die Mindestkriterien erfüllt, ist eine Ableitung einer ERB möglich. Widersprechen sich die Ableitungen quantitativ, so ist die Risikoquantifizierung nach dem Prinzip des „weight of evidence“ vorzunehmen. Ist hier auch keine eindeutige Gewichtung möglich, wird die vorsichtigere Bewertung herangezogen.
In diesem Zusammenhang bedeutet eine „weight of evidence“-Betrachtung nicht notwendigerweise eine schlechte Datenlage und eine Mittelung von tierexperimentellen Daten und Humandaten, sondern kann auch die Auswahl der plausibleren Datenbasis (Humandaten, Tierdaten) beinhalten. Die Auswahl ist zu begründen.

9   Anforderungen an Dokumentation

9.1   Begründungspapiere

(1) Regulatorische Setzungen (z. B. von Grenzwerten und mit Risikohöhen verknüpfte Auflagen an das Risikomanagement) erfordern Transparenz, die Möglichkeit der Überprüfung, Kritik, Ergänzung und Aktualisierung, und somit eine ausreichende und öffentliche Dokumentation. Im vorliegenden Fall sind deshalb öffentlich zugängliche Begründungspapiere für die Ableitung von stoffbezogenen Expositions-Risiko-Beziehungen und Risikokonzentrationen zu erstellen.
Ein einheitliches Formular mit Hinweisen zum Ausfüllen ist diesem Leitfaden als Anhang angefügt (vgl. Anhang 10.4).
(2) Begründungspapiere können in ihrem methodischen Bezug auf diesen Leitfaden verweisen, so dass z. B. Defaultfaktoren oder methodische Einzelschritte bei Übereinstimmung mit den Angaben in diesem Leitfaden nicht in jedem Einzelfall detailliert begründet werden müssen. Der Verweis sollte jedoch explizit erfolgen (z. B. „Die Verkürzung der Expositionsdauer wurde entsprechend den Regeln des Leitfadens, Abschnitt 4.5, berücksichtigt).
(3) Soweit Begründungspapiere auf veröffentlichten Daten beruhen und in der zitierten Quelle alle erforderlichen Angaben enthalten sind (vgl. auch Mindestkriterien nach Abschnitt 8), ist ein eindeutiges Zitat der Quelle zur Beschreibung der Datenbasis einer Risikoquantifizierung ausreichend.
(4) Schwerpunkte eines Begründungspapiers sind (a) Begründungen zum angenommenen vorherrschenden Wirkprinzip (vgl. Abschnitt 2), (b) Abweichungen vom in diesem Leitfaden vorgesehen Defaultvorgehen, (c) Auswahl der Tumorlokalisation (einschließlich Spezies, Geschlecht etc., vgl. Abschnitt 3.1), (d) Darstellung der mathematischen Berechnung, und (e) der Vergleich zwischen dem Risiko für krebserzeugende Wirkungen und nichtkanzerogener Wirkstärke.
Ferner ergibt sich immer dann ein Begründungsbedarf, wenn dies in einzelnen Abschnitten dieses Leitfadens explizit gefordert wird.
(5) Es ist ein Abschnitt Schlussfolgerung (Kapitel 9 in der Anlage 10.4) als eigenständiges Kapitel der Begründung so zu gestalten, dass es ohne Lektüre des Hauptteils auch als Zusammenfassung verstanden werden kann.
(6) Ein Verweis auf Risikoquantifizierungen durch Dritte und die dort erfolgten Begründung ist nur dann ausreichend, wenn die zitierte Referenz den Anforderungen dieses Leitfadens in Methodik und Transparenz entspricht.
(7) Es gelten spezielle Anforderungen an die Dokumentation, wenn keine Risikokonzentrationen quantifiziert werden können.
(8) Wenn das Benchmarkverfahren oder die MPPD-Methodik (zur Berechnung einer humanäquivalenten Konzentration, HEC) angewendet werden, so ist das entsprechende Berechnungsprotokoll als Anhang der ERB-Begründung anzufügen.

9.2   Bearbeitungsabfolge

In der folgenden Abbildung 4 ist die prinzipielle Verknüpfung der Methodikelemente und Arbeitsschritte in einem Flussdiagramm zusammengefasst.
Abbildung 4
Schematische Darstellung der Ableitung einer Expositions-Risiko-Beziehung (ERB) nach dem vorliegenden Leitfaden; Nummerierung in blauen Kreisfeldern entspricht der Kapitelnummer im Leitfaden
Abbildung 4Schematische Darstellung der Ableitung einer Expositions-Risiko-Beziehung (ERB) nach dem vorliegenden Leitfaden; Nummerierung in blauen Kreisfeldern entspricht der Kapitelnummer im Leitfaden