Oligonukleotidkartierung mittels Massenspektrometrie, um eine umfassende Charakterisierung der Primärstruktur eines mRNA-Impfstoffs gegen SARS zu ermöglichen

Nachricht

HeimHeim / Nachricht / Oligonukleotidkartierung mittels Massenspektrometrie, um eine umfassende Charakterisierung der Primärstruktur eines mRNA-Impfstoffs gegen SARS zu ermöglichen

Oct 25, 2023

Oligonukleotidkartierung mittels Massenspektrometrie, um eine umfassende Charakterisierung der Primärstruktur eines mRNA-Impfstoffs gegen SARS zu ermöglichen

Wissenschaftliche Berichte Band 13,

Wissenschaftliche Berichte Band 13, Artikelnummer: 9038 (2023) Diesen Artikel zitieren

1872 Zugriffe

256 Altmetrisch

Details zu den Metriken

Die Oligonukleotidkartierung mittels Flüssigkeitschromatographie mit UV-Detektion gekoppelt mit Tandem-Massenspektrometrie (LC-UV-MS/MS) wurde kürzlich entwickelt, um die Entwicklung von Comirnaty zu unterstützen, dem weltweit ersten kommerziellen mRNA-Impfstoff, der gegen das SARS-CoV-2-Virus immunisiert. Analog zur Peptidkartierung therapeutischer Proteinmodalitäten ermöglicht die hier beschriebene Oligonukleotidkartierung eine direkte Primärstrukturcharakterisierung von mRNA durch enzymatischen Verdau, genaue Massenbestimmungen und optimierte kollisionsinduzierte Fragmentierung. Bei der Probenvorbereitung für die Oligonukleotidkartierung handelt es sich um einen schnellen Eintopf-Ein-Enzym-Verdau. Der Aufschluss wird mittels LC-MS/MS mit einem erweiterten Gradienten analysiert und die resultierende Datenanalyse erfolgt mithilfe halbautomatischer Software. In einer einzigen Methode umfassen die Oligonukleotid-Kartierungsauslesungen ein hoch reproduzierbares und vollständig annotiertes UV-Chromatogramm mit 100 % maximaler Sequenzabdeckung sowie eine Mikroheterogenitätsbewertung der 5‘-Terminus-Verkappung und der 3‘-Terminus-Poly(A)-Schwanzlänge. Die Kartierung von Oligonukleotiden war von entscheidender Bedeutung, um die Qualität, Sicherheit und Wirksamkeit von mRNA-Impfstoffen sicherzustellen, indem sie Folgendes lieferte: Bestätigung der Konstruktidentität und Primärstruktur sowie Bewertung der Produktvergleichbarkeit nach Änderungen im Herstellungsprozess. Im weiteren Sinne kann diese Technik verwendet werden, um die Primärstruktur von RNA-Molekülen im Allgemeinen direkt abzufragen.

Zwei Boten-RNA-Impfstoffe (mRNA), Comirnaty von Pfizer-BioNTech und Spikevax von Moderna, wurden von der FDA, der EMA und anderen Aufsichtsbehörden weltweit zur Bekämpfung der Coronavirus-Pandemie 2019 (COVID-19) zugelassen1,2. COVID-19 wird durch eine schwere Infektion mit dem akuten respiratorischen Syndrom Coronavirus-2 (SARS-CoV-2) verursacht3. mRNA-Impfstoffe können zur Immunisierung verwendet werden, da sie die genetischen Anweisungen für die Selbsttranslation des immunogenen Zielproteins enthalten4. mRNA in zugelassenen COVID-19-Impfstoffen kodiert für das S-2P-Protein5, das sich vom SARS-CoV-2-Spike-Protein durch zwei stabilisierende Prolinmutationen unterscheidet, die eine Präfusionskonformation erzeugen6.mRNA-Wirkstoff (DS) wird durch In-vitro-Transkription hergestellt ( IVT) unter Verwendung der Bakteriophagen-T7-Polymerase mit N1-Methylpseudouridin zur Bildung einer nukleosidmodifizierten Messenger-RNA (modRNA). modRNA DS wird anschließend mit Lipid-Nanopartikeln (LNPs) zur zellulären Abgabe und zum Schutz vor abbauenden Kräften eingekapselt. Formulierte modRNA-LNPs umfassen das Arzneimittel (DP), das zur Impfung verabreicht wird.

Arzneimittelhersteller haben die uneingeschränkte Verantwortung, die molekulare Struktur, Sequenz, Heterogenität und Verunreinigungen der von ihnen vermarkteten endgültigen Arzneimittel und Impfstoffe zu charakterisieren und zu verstehen. Die allgemeine Primärstruktur von mRNA DS vom 5‘- zum 3‘-Ende ist: 5‘-Kappe, 5‘-untranslatierte Region (UTR), Antigen-kodierende Region, 3‘-UTR und 3‘-Polyadenosinschwanz (Poly(A) -tail)7 in einem einzelsträngigen Format. Um translatorisch kompetent zu sein, muss die mRNA an ihrem 5‘-Ende verschlossen sein8 und über einen Poly(A)-Schwanz mit einer ausreichenden Anzahl aufeinanderfolgender Adenosinnukleotide9 verfügen. Bei der 5′-Kappe handelt es sich häufig um ein 5′-terminales N7-methyliertes Guanosintriphosphat, das mit dem 5′-Kohlenstoff der Ribose des nächsten Adenosin- oder Guanosinnukleotids verbunden ist, das auch an seinem 2′-Kohlenstoff methoxyliert sein kann10. Diese Eigenschaften der 5′-Kappe und des Poly(A)-Schwanzes verleihen auch Stabilität, indem sie die mRNA vor zellulären Abbauprozessen schützen11,12. Die Integrität der mRNA-Primärstruktur voller Länge, einschließlich der 5′-Kappe und der Poly(A)-Schwanztermini, stellt kritische Qualitätsmerkmale für Impfstoff-DS dar, die genau überwacht werden, um die gewünschte Produktqualität sicherzustellen.

In den letzten Jahrzehnten wurden mehrere chromatographische und elektrophoretische „Oligonukleotid-Mapping“-Techniken entwickelt13,14,15. In jüngerer Zeit wurden auf Massenspektrometrie (MS) basierende Methoden zur mRNA-Charakterisierung unter Verwendung von Ionenpaar-Umkehrphasen-Hochleistungsflüssigkeitschromatographie in Verbindung mit Massenspektrometrie (IP RP-HPLC-MS) für eine detaillierte Charakterisierung des 5′-Cap16 von mRNA-Impfstoffen entwickelt und 3′-Poly(A)-Schwanz17. Diese erfordern jedoch eine Reinigung und spezielle Analysemethoden zur Charakterisierung jedes Terminus. Kürzlich wurden zusätzliche Analysemethoden entwickelt, die enzymatische Verdauungen und IP-RP-HPLC mit und ohne Tandem-MS (MS/MS) für die Oligonukleotidsequenzierung großer RNA nutzen18,19,20,21,22. Verschiedene in Lösung befindliche Enzyme22 oder immobilisierte RNase T1 auf magnetischen Partikeln wurden auf eine verbesserte Sequenzabdeckung untersucht. Nakayama et al. entwickelte eine LC-MS-basierte mRNA-Profilierungsmethode unter Verwendung stabiler isotopenmarkierter Standards. Trotz der bahnbrechenden Arbeit zur Charakterisierung der RNA-Primärstruktur, die zuvor diskutiert wurde18,19,20,21,22, ist es für das Fachgebiet von Vorteil, über eine Analysemethode zu verfügen, die sowohl umfassend als auch einfach anzuwenden ist. Eine ideale Oligonukleotidkarte, die für eine einfache Implementierung geeignet ist, ist in der Lage, die gesamte Länge der RNA, einschließlich der 5′-Cap- und 3′-terminalen Heterogenität, in einem Eintopf-Ein-Enzym-Verdau direkt und effizient zu charakterisieren, ohne dass eine stabile Isotopenmarkierung erforderlich ist Kontrollen. Es löst Sequenzisomere auf und erstellt ein vollständig kommentiertes UV-Chromatogramm mit einer Karte der maximalen Sequenzabdeckung.

Hier beschreiben wir eine Oligonukleotid-Kartierungsmethode zur direkten, umfassenden Charakterisierung der mRNA-Primärstruktur in voller Länge, wobei wir Comirnaty als Fallstudie verwenden. Unsere Oligonukleotid-Kartierungsmethode nutzt modernste Ionenpaar-Umkehrphasen-Ultrahochleistungsflüssigkeitschromatographie mit UV-Detektion (IP-RP-UHPLC-UV), gekoppelt mit ultrahochauflösender Elektrospray-Ionisations-Tandem-Massenspektrometrie (ESI MS/MS). Trennen und identifizieren Sie die Oligonukleotidfragmente, die durch den Ribonuklease T1 (RNase T1)-Verdau entstehen. Maßgeschneiderte Datenanalysetools ermöglichen umfassende halbautomatische Auslesungen der Primärstruktur: (1) UV-Chromatogramm, vollständig mit Hunderten von Verdauungsprodukten versehen, die den spezifischen Fingerabdruck der mRNA-Primärstruktur darstellen, (2) Abdeckungskarte, die eine einzigartige und maximale Sequenzabdeckung zeigt, ( 3) 5′-Cap- und 3′-terminale Mikroheterogenitätsbewertung.

Der Pfizer-BioNTech-COVID-19-Impfstoff wurde im Juli 202223 in 186 Märkten weltweit eingeführt. Um diese Einführung zu erleichtern, wurde eine Reihe von Strukturaufklärungs- und Vergleichsstudien mithilfe der Oligonukleotidkartierung durchgeführt und bei Gesundheitsbehörden weltweit eingereicht. Dies zeigte, dass neue DS-Produktionsstandorte und größere Produktionsmaßstäbe, die zur Erweiterung der Kapazität und der weltweiten Versorgung mit dem Impfstoff eingeführt wurden, mRNA mit vergleichbarer Produktqualität wie heutige Chargen produzierten. Hier ermöglichte unsere Oligonukleotid-Kartierungsmethode die vollständige Bewertung der Primärstruktur von Comirnaty DS in einer einzigen Methode mit einer maximalen Sequenzabdeckung von 100 %. Optimierte MS/MS-Fragmentierungsparameter und spezielle Software in Verbindung mit kommerzieller Software waren für die Unterscheidung von Oligonukleotidsequenzisomeren für eine hohe maximale Sequenzabdeckung von entscheidender Bedeutung. Unsere umfassende, halbautomatische Oligonukleotid-Kartierungsmethode wurde entwickelt, um eine verbesserte Charakterisierung von Sequenzen, terminalen Formen und möglichen Modifikationen durch mRNA in voller Länge zu ermöglichen. Es ist ein entscheidender Bestandteil des Verständnisses der mRNA-Primärstruktur und der Vergleichbarkeitsbewertung und kann als orthogonaler DS-Identitätstest zur Unterscheidung sehr ähnlicher mRNA-Sequenzen verwendet werden, die von SARS-CoV-2-Varianten abgeleitet sind.

Die Oligonukleotidkartierung wurde mit einer repräsentativen Charge von Comirnaty BNT162b2 Original DS (d. h. dem ursprünglichen Pfizer-BioNTech COVID-19-Impfstoff, der für das Spike-Glykoprotein (S) des SARS-CoV-2-Virus, dem Wuhan-Hu-1-Isolat, kodiert, entwickelt : GenBank: QHD43416.1) und wurde auf nachfolgende Comirnaty BNT162b2-Konstrukte (BNT162b2s04 [Delta] und BNT162b2s05 [Omicron]) und andere Portfolio-mRNA-Moleküle angewendet. Fünfzig Mikrogramm mRNA DS wurden mit 2500 U RNase T1 in einem 50 mM Tris(hydroxymethyl)aminomethan (Tris) pH 7,5-Puffer mit 20 mM Ethylendiamintetraessigsäure (EDTA) 90 Minuten bei 37 °C verdaut. Die resultierende Enzymfragmentlösung wurde mit 10x Triethylamin (TEA) und 1,1,1,3,3,3-Hexafluor-2-propanol (HFIP)-Emulsion versetzt, um eine endgültige Vol.-Konzentration von 0,1 % TEA 1 % zu ergeben. HFIP. Eine Ladung von 4 µg wurde injiziert und die Fragmente wurden durch Ionenpaar-Umkehrphasen-Ultrahochleistungsflüssigkeitschromatographie (IP RP-UHPLC) mit UV-Detektion bei 260 nm unter Verwendung eines 1290 Infinity II Bio LC-Systems (Agilent) gepaart mit einem ACQUITY Premier Oligonukleotid getrennt C18-Säule: 130 Å, 1,7 µm, 2,1 × 150 mm (Waters). Jede mobile Phase enthielt 0,1 % TEA und 1 % HFIP. Das TEA fungiert als Ionenpaarmittel und das HFIP sorgt als flüchtige schwache Säure für MS-kompatible Pufferung. Der Gradient stieg in 195 Minuten von 1 auf 17 % mobile Phase B (50 % Methanol), dann 17–35 % B in 60 Minuten, gefolgt von Wasch- und Äquilibrierungsabschnitten. Die Flussrate betrug 0,2 ml/min mit einer Nachsäulenaufteilung: 50 µl/min zum UV-Diodenarray-Detektor und 150 µl/min zu einem Orbitrap Eclipse Tribrid-Massenspektrometer (Thermo Fisher Scientific). Die Online-MS-Erfassung mit Elektrospray-Ionisation (ESI) erfolgte im Negativionenmodus mit einer Sprühspannung von 2700 V. Die MS-Scans lagen bei 400 bis 2000 m/z bei 120.000 Auflösungsvermögen (RP) bei 400 m/z. Die Tandem-Massenspektrometrie (MS/MS) wurde bei 30.000 RP durch eine 17, 21, 25-stufige Kollisionsdissoziation (HCD) mit höherer Energie mehrfach geladener Vorläuferkandidaten durchgeführt, die durch den datenabhängigen Erfassungsalgorithmus (DDA) ausgewählt wurden.

Die Software BioPharma Finder Version 5.0 (Thermo Fisher Scientific) wurde verwendet, um Oligonukleotide basierend auf MS- und MS/MS-Übereinstimmungen mit theoretischen RNase T1-Verdauprodukten zu identifizieren. Für eine MS-Übereinstimmung musste die beobachtete neutrale Oligonukleotidmasse innerhalb von 5 ppm der theoretischen Masse liegen. Eine MS/MS-Übereinstimmung erforderte, dass alle Hauptfragmente identifiziert wurden und dass die vollständige Sequenz aus Fragmentionen abgeleitet werden konnte, die die 5‘- oder 3‘-Enden enthielten (keine internen Fragmente). Um sicherzustellen, dass die automatisierte Software einen stringenten MS/MS-Abgleich einsetzte, durchsuchte die Software auch den gesamten LC-MS/MS-Datensatz mit theoretischen RNase-T1-Verdaus von Täuschungskonstrukten mit zufälliger Anordnung der gleichen Nukleotidzusammensetzung wie das mRNA-Molekül. Um die Liste der automatisierten Softwareidentifizierungen zu erweitern, wurden Excel Visual Basic for Applications (VBA)-Skripte verwendet, um nicht identifizierte LC-UV-Merkmale und zugrunde liegende Massenspektren einzeln zu untersuchen. Zur Charakterisierung der 5′- oder 3′-Termini, einschließlich des 73-mer R1062 und seiner verwandten Poly(A)-Schwanzspezies, wurde die Byos-Software von Protein Metrics eingesetzt. Die 5′- oder 3′-Identifizierungen wurden unter Verwendung entfalteter Nullladungs-Massenspektren ohne MS/MS durchgeführt.

Die detaillierte Schritt-für-Schritt-Methode wird als ergänzendes Datendokument bereitgestellt, das die enzymatische Behandlung der Probe, die Trennung und den Nachweis von Oligonukleotiden durch UHPLC-UV sowie die Oligonukleotididentifizierung durch hochauflösende Massenspektrometrie beschreibt. Außerdem wird beschrieben, wie Sie mehrere Excel-VBA-Tools, die BioPharma-Finder-Software und Protein Metrics Byos verwenden, um eine bessere Charakterisierung des mRNA-Verdaus zu erreichen.

Die Primärstruktur der für einen Impfstoff oder ein therapeutisches Arzneimittel vorgesehenen mRNA wird von den Aufsichtsbehörden als kritisches Qualitätsmerkmal angesehen und muss empirisch auf Integrität bestätigt werden, um Qualität, Sicherheit und Wirksamkeit sicherzustellen. Die ideale Technik zur Charakterisierung der Primärstruktur ermöglicht eine eindeutige Aufklärung der mRNA-Sequenz in voller Länge, der 5′- und 3′-Termini und aller ortsspezifischen Modifikationen durch direkte Messung des mRNA-Moleküls.

Zur direkten Charakterisierung der Original-mRNA-Primärstruktur von Comirnaty BNT162b2 wurde eine Einzelenzym-Oligonukleotid-Kartierungsmethode entwickelt, indem IP-RP-HPLC-UV-MS und MS/MS kombiniert wurden, um alle über den RNase-T1-Verdau produzierten Oligonukleotide zu trennen und zu identifizieren. Es ermöglichte den Nachweis von 388 Oligonukleotiden. 74 dieser Oligonukleotide kommen im Konstrukt mehrfach vor: Es handelt sich um Sequenzmotivwiederholungen mit unterschiedlichen Startpositionen (Loci). Wenn solche beobachteten Oligonukleotide bei der RNase-T1-Verdauung von jedem Locus im Konstrukt stammen, dann wurden alle 4283 theoretischen Nukleotide in BNT162b2 mit der Methode abgetastet. Somit betrug die mögliche maximale Sequenzabdeckung, die mit dieser Methode erreicht wurde, 100 %. Die anderen 314 Oligonukleotide stammen jeweils von einem einzelnen Locus im Konstrukt. Über ihren Ursprung besteht keine Unklarheit: Sie machen 2380 Nukleotide aus, was einer einzigartigen Sequenzabdeckung von 55,6 % entspricht. Mit Ausnahme der langen Poly(A)-Schwanz-Oligonukleotide wurden alle Oligonukleotide durch MS/MS-Fragmentierungsspektrum-Matching identifiziert.

Der RNase-T1-Verdau von RNA spaltet das Phosphodiester-Rückgrat auf der 3′-Seite jedes Guanosin-Nukleotids und hinterlässt ein Phosphat am 3′-Kohlenstoff der Guanosin-Ribose am 3′-Ende. Somit gibt es kein Phosphat am 5'-Kohlenstoff der 5'-Endnukleotid-Ribose eines RNase-T1-Verdauungsprodukts. Ein Fehlspaltungsverdauungsprodukt ist ein Oligonukleotid mit einem oder mehreren internen (nicht 3′-terminalen) Guanosinnukleotiden. Bei einem theoretischen RNase-T1-Verdau von BNT162b2 entstehen 1062 Oligonukleotide, die aufgrund von Sequenzmotivwiederholungen im Konstrukt zu 302 einzigartigen Oligonukleotiden gruppiert werden. Von den 388 in der Studie identifizierten Oligonukleotiden sind 302 theoretische Verdauungsprodukte von RNase T1. Die anderen 86 Oligonukleotide umfassen 23 zusätzliche Poly(A)-Schwanz-, 49 fehlende Spaltungs- und 14 unspezifische Spaltungs-Oligonukleotide (Ergänzungsdatentabelle 1).

Die erste Ausgabe der Oligonukleotidkartierung ist ein vollständig kommentiertes UV-Chromatogramm der RNase T1-Verdauungsprodukte (Abb. 1A), das durch Anpassen der Retentionszeiten jedes durch MS identifizierten Oligonukleotids an seinen entsprechenden UV-Peak erstellt wird. Im Allgemeinen trennt die Methode die Arten nach der Anzahl der Nukleotidreste, wobei kürzere Oligonukleotide vor längeren Oligonukleotiden eluieren. Die vorherrschenden stationären Umkehrphasen-Analyt-Wechselwirkungen bestehen mit Triethylammonium-Phosphodiester-Rückgrat-Ionenpaaren. Für jede Teilmenge der Oligonukleotidlängen wird die Elutionsreihenfolge durch die Zusammensetzung der Nukleobasen und die Sequenz beeinflusst. Insbesondere das 5′-Ende-Nukleotid beeinflusst diese Reihenfolge. Bei Oligonukleotiden gleicher Länge lautet die Elutionsreihenfolge in der Regel zuerst C, dann V und dann A (V steht für N1-Methylpseudouridin; ergänzende Daten, Abb. 1).

RNase T1-Oligonukleotidkarte von BNT162b2 Original DS. (A) IP RP-UHPLC-UV-MS/MS RNase T1-Oligonukleotidkarte von BNT162b2 Original DS, 14–254 Min. „R“ stellt Oligonukleotid-RNase-T1-Verdauungsprodukte dar, die vom 5′- zum 3′-Ende indiziert sind. „*“ bezeichnet ein Sequenzwiederholungs-Oligonukleotid, wobei die einzelne Peakzuordnung alle identischen Oligonukleotide in der Sequenz darstellt. Jede Farbe kennzeichnet die Anzahl der Nukleotide pro Verdauungsprodukt: Blau: 4, 10 und 16; grün: 5 und 11; Gold: 6 und 12; Rot: 7 und 13, Lila: 8 und 14, Schwarz: 9 und 15, Magenta: > 16. Aus Gründen der grafischen Klarheit sind nicht alle beobachteten Oligonukleotide im Chromatogramm mit Anmerkungen versehen; Eine vollständige Liste finden Sie in der Ergänzungsdatentabelle 1. (B) IP-RP-UHPLC/UV/MS/MS-RNase-T1-Oligonukleotidkarte von BNT162b2 Original DS, 0–20 Min. „R“ stellt Oligonukleotid-RNase-T1-Verdauungsprodukte dar, die vom 5′- zum 3′-Ende indiziert sind. „*“ bezeichnet ein Sequenzwiederholungs-Oligonukleotid, wobei die einzelne Peakzuordnung alle identischen Oligonukleotide in der Sequenz darstellt. Jede Farbe kennzeichnet die Anzahl der Nukleotide pro Verdauungsprodukt: Rot: 1; lila: 2; schwarz: 3; blau: 4; grün: 5. Aus Gründen der grafischen Klarheit sind nicht alle beobachteten Oligonukleotide im Chromatogramm mit Anmerkungen versehen; Eine vollständige Liste finden Sie in der Ergänzungsdatentabelle 1. (C) Die 55,6 %ige Abdeckung einzigartiger Sequenzen ist durch Blau und Grün schattiert dargestellt, basierend auf 314 beobachteten Oligonukleotiden mit eindeutiger Sequenz. Blaue Nukleotide umfassen RNase-T1-Oligonukleotide mit eindeutiger Sequenz; Grüne Nukleotide umfassen Fehlspaltungs- und Fragment-Oligonukleotide mit eindeutiger Sequenz. Grüne und weiße Nukleotide umfassen auch Wiederholungssequenz-RNase-T1-Oligonukleotide, basierend auf 74 beobachteten Wiederholungssequenz-Oligonukleotiden. „V“ ist N1-Methylpseudouridin.

Aufgrund von Sequenzmotivwiederholungen stammen einige Merkmale in der Oligokarte von mehr als einem Verdauungsort. Beispielsweise ist das „AAAG“-Verdauungsprodukt, das nach 15,8 Minuten eluiert, ein Sequenzwiederholungs-Oligonukleotid, das von einem oder bis zu allen 4 seiner Loci in der Sequenz stammen kann. Der erste AAAG-Locus im BNT162b2-Konstrukt befindet sich bei den Nukleotidresten 514–517; es folgt dem 118. G, gezählt vom 5′-Ende und wird daher als „R119“-Oligonukleotid bezeichnet. Dieses Oligonukleotid-4-mer hat vier UV-260-nm-Chromophore und seine LC/UV-Peakfläche beträgt 2,88 × 105 (Ergänzungsdatentabelle 1). Mit dieser Spezies koeluieren keine anderen Oligonukleotide. Das 15-mer R606 mit der Sequenz ACCCCVCCVAVCAAG eluiert bei 205 Minuten ohne koeluierende Spezies und mit einer Peakfläche von 2,55 × 105. Aufgrund der Ähnlichkeit der Peakflächen und der Stöchiometrie der Chromophore kann man vernünftigerweise auf das 16-Minuten-AAAG-Merkmal schließen bestehend aus allen vier RNase T1 AAAG-Oligonukleotid-Verdauungsprodukten (R119, R731, R914 und R1046). Die beobachteten LC/UV-Peakflächen aller Peaks wurden mit ihren vorhergesagten (theoretischen) Peakflächen aufgrund ihrer Oligonukleotidzuordnung verglichen, was zeigt, dass LC-UV-Peaks, die aus Sequenzwiederholungs-Oligonukleotiden bestehen, Beiträge von allen ihren Loci haben (Ergänzende Daten, Abb. 2). . Somit erreichte die Oligonukleotidkartierung von BNT162b2 eine mögliche maximale Sequenzabdeckung von 100 %.

Um das Oligonukleotid-Kartenchromatogramm in Abb. 1 zu vereinfachen, wurden Wiederholungssequenzen mit der ersten Locus-Instanz mit einem Sternchen-Suffix versehen; Daher ist das 16-Minuten-Feature „R119*“. Die meisten „*“-Peaks sind kleine Oligonukleotide: 1-mere (G), 2-mere (AG, CG, VG), 3-mere (AAG usw.); das größte ist ein 8-mer, VACAVCVG, das an zwei Standorten vorkommt (R566 und R947). Diese Wiederholungssequenzen machen einen wesentlichen Teil des BNT162b2-Konstrukts aus. Das frühe UV-Chromatogramm (Abb. 1A und B) zeigt Peaks, die Wiederholungssequenzen darstellen, mit signifikanten Peakflächen, die der Anzahl der Loci für jede Art entsprechen (Ergänzungsdatentabelle 1).

Während fehlende Spaltungsspezies in geringen Mengen nachgewiesen werden, deuten diese zahlreichen Wiederholungssequenzen darauf hin, dass der RNase T1-Verdau nach 90 Minuten weitgehend abgeschlossen ist. Ähnlich wie bei der herkömmlichen Behandlung nicht eindeutiger Peptide bei der Peptidkartierung mittels LC-MS/MS24 wird jeder Locus eines nicht eindeutigen Oligonukleotids bei der Bestimmung der maximalen Sequenzabdeckung berücksichtigt. Dies ist auch angesichts der Korrelation zwischen beobachteten und vorhergesagten UV-Peakflächen gerechtfertigt (Ergänzungsdaten, Abb. 2).

Die zweite Ausgabe der Oligonukleotidkartierung ist die eindeutige Sequenzabdeckungskarte jedes erkannten Nukleotids (Abb. 1C). Unter Berücksichtigung der Untergruppe der Oligonukleotide, die nur einen Locus haben, betrug die eindeutige Sequenzabdeckung 55,5 %. Es wurden alle theoretischen Oligonukleotide mit eindeutiger Sequenz für den RNase-T1-Verdau beobachtet.

Bei der Herstellung von mRNA-Impfstoffen kommt es häufig zu Änderungen des klinischen und kommerziellen Herstellungsprozesses (z. B. Standort, Umfang), und Analysetechniken müssen die Produktvergleichbarkeit für Chargen vor und nach der Änderung nachweisen25. Die Oligonukleotidkartierung ermöglicht eine direkte, detaillierte Bewertung der Vergleichbarkeit der mRNA-Primärstruktur über mehrere mRNA-DS-Chargen hinweg. Dies ist analog zur Anwendung der Peptidkartierung mittels LC-UV-MS/MS zur Vergleichbarkeitsbewertung therapeutischer Proteinchargen26. Die mRNA-Primärstruktur von drei kommerziellen BNT162b2-Chargen wurde als vergleichbar erachtet (Abb. 2A), wie durch die Überlagerung der Chromatogramme in voller Länge und durch die Überlagerung vergrößerter Segmente der Chromatogramme gezeigt wird (Ergänzungsdaten, Abb. 3).

Chargenvergleichbarkeit und Konstruktidentität durch Oligonukleotidkartierung getestet. (A) Drei GMP-hergestellte BNT162b2 Original DS-Chargen wurden durch Oligonukleotidkartierung bewertet. Die resultierenden UV-Chromatogramme sind visuell vergleichbar und zeigen die Prozesskonsistenz. Ergänzende Daten Abb. 3 zeigt eine Vergrößerung dieser Daten um sechs Segmente. Charge 3 wurde in kleinem Maßstab hergestellt; Die Chargen 1 und 2 wurden nach dem gleichen GMP-Verfahren hergestellt. (B) Partielle Oligonukleotidkarten des BNT162b2 Original, BNT162b2 Delta und BNT162b2 Omicron mRNA DS. Die schwarz dargestellten RNase T1-verdauten Oligonukleotidsequenzen werden von allen drei Variantenkonstrukten gemeinsam genutzt; blaue Sequenzen werden von BNT162b2-Original- und BNT162b2-Delta-Konstrukten gemeinsam genutzt; Grün wird von BNT162b2 Original und BNT162b2 Omicron-Konstrukten geteilt; und orange und rote Oligonukleotide sind jeweils einzigartig für die BNT162b2 Delta- und BNT162b2 Omicron-Konstrukte. (C) Partielle Oligonukleotidkarten von zwei Chargen von BNT162b2 Original überlagert (oberer Bereich) und einer BNT162b2 Original-Charge überlagert mit BNT162b2 Delta (unterer Bereich). Unterschiede zwischen den Chromatogrammen des BNT162b2-Originals und des BNT162b2-Delta-Konstrukts werden mit den Oligonukleotiden versehen, die den Unterschied ausmachen. Blaue Oligonukleotide werden von den BNT162b2-Original- und BNT162b2-Delta-Konstrukten gemeinsam genutzt; Das orangefarbene Oligonukleotid ist einzigartig für das BNT162b2-Delta-Konstrukt. Die Zahlen in Klammern zählen die Anzahl der Sequenzwiederholungen in jeder Konstruktsequenz: Rot gibt die Anzahl der Vorkommen im BNT162b2-Delta-Konstrukt an und Schwarz gibt die Anzahl der Vorkommen im BNT162b2-Originalkonstrukt an.

In einer ähnlichen vergleichenden Analyse kann die Oligonukleotidkartierung einzigartige und subtile Varianzen in der mRNA-Primärstruktur identifizieren. Die Sequenzen der SARS-CoV-2-Delta- und Omicron-Varianten-Impfstoffkonstrukte, BNT162b2 Delta und BNT162b2 Omicron, ähneln zu 99,6 % bzw. 98,6 % dem BNT162b2-Original, wie in den ergänzenden Daten in Abb. 4 dargestellt. Die mRNA-Primärstrukturen aller drei Konstrukte zeigten deutliche Peaks Profilunterschiede durch Oligonukleotidkartierung (Abb. 2B), aufgrund von Oligonukleotiden, die in mindestens einem der drei vorhanden sind oder darin fehlen. Von den beiden Original-, einem Delta- und 15 Omicron-Oligonukleotiden, die für ihr Konstrukt einzigartig sind, wurden 16 durch UV- und extrahierte Ionenchromatogrammanalyse in der erwarteten Weise deutlich unterschieden (in zwei Konstruktkarten nicht vorhanden, in einer vorhanden; ergänzende Daten Abb. 5). Siebzehn der 18 Patienten hatten eine diffinitive MS/MS. Nur das Omicron-spezifische 4-mer-VCAG eluierte zusammen mit Sequenzisomeren, was eine sichere MS/MS-Identifizierung ausschloss.

Die Oligonukleotidkartierung zeigt auch subtile Unterschiede in der Primärstruktur dieser Variantenkonstrukte. Im 16–30-minütigen chromatographischen Fenster werden drei auffällige Unterschiede zwischen BNT162b2-Original-BNT162b2-Delta-Oligonukleotiden beobachtet (Abb. 2C). Der erste Unterschied ist eine erhöhte vordere Schulter des 19-minütigen Delta-UV-Peaks. Dies wird durch das Oligonukleotid CCVVG erklärt, das in der BNT162b2-Delta-Karte identifiziert wurde, nicht jedoch in der BNT162b2-Originalkarte. Es handelt sich um ein erwartetes RNase-T1-Verdauprodukt nur der BNT162b2-Delta-Sequenz und stellt einen Unterschied zwischen der BNT162b2-Original- und der BNT162b2-Delta-Sequenz dar. Der UV-Peak bei 21,8 Minuten, identifiziert als VVCCG, ist im Delta-Chromatogramm von BNT162b2 weniger häufig als im Original-Chromatogramm von BNT162b2. Dies liegt daran, dass es sich um ein Sequenzwiederholungs-Oligonukleotid mit zwei Loci in der BNT162b2-Originalsequenz und einem Locus in der BNT162b2-Deltasequenz handelt. Umgekehrt ist der UV-Peak bei 27,0 Minuten, der als ACCAG identifiziert wird, in Delta häufiger als im BNT162b2-Original, da dieses Oligonukleotid von fünf Loci in der ersteren Sequenz und vier Loci in der letzteren stammt.

Wichtig ist, dass in diesem 16–30-minütigen chromatographischen Fenster (Abb. 2C) keine weiteren Unterschiede erkennbar sind, was mit der theoretischen Tabelle der erwarteten RNase T1-Verdau-Oligonukleotide übereinstimmt. Eine genaue Überlappung zwischen den Chromatogrammen dieser Varianten zeigt, dass sie die gleiche stöchiometrische Anzahl eines einzelnen Oligonukleotids oder Satzes von Oligonukleotiden aufweisen. Darüber hinaus bietet die vergleichende Analyse von BNT162b2 Original vs. Delta durch Oligonukleotidkartierung einen wichtigen visuellen Kontrapunkt zum Chargenvergleich, bei dem die Behauptung der visuellen Vergleichbarkeit durch Überlagerung angemessen ist.

Die richtige Verkappung des 5‘-Terminus und die passende Länge des Poly(A)-3‘-Endes sind entscheidende Qualitätsmerkmale für einen mRNA-Impfstoff oder ein mRNA-Therapeutikum. Die hier entwickelte Oligonukleotidkarte ermöglicht die direkte Charakterisierung der 5′-Kappe und des 3′-Poly(A)-Schwanzes in einer einzigen Technik, ohne dass eine Isolierung und Reinigung eines der Terminus erforderlich ist (Abb. 3). Extrahierte Ionenchromatogramme des 5′-Terminus (Abb. 3A) und die begleitenden entfalteten Massenspektren zeigen den eindeutigen Nachweis von unverkappten Spezies im Spurenbereich (5′ppp-AG, wie in Abb. 3A und B angegeben) im Vergleich zur ordnungsgemäß verschlossenen Form ( 5′ cap-AG wie in Abb. 3A und C dargestellt) in BNT162b2 Original, Delta und Omicron, unter Verwendung einer hochauflösenden, genauen Masse. Der Großteil des 5′-Endes ist in jedem Konstrukt ordnungsgemäß abgedeckt (dies wurde durch eine orthogonale LC-UV-basierte Analyse bestätigt – Daten nicht gezeigt).

Die Oligonukleotidkartierung von mRNA ermöglicht die gleichzeitige Charakterisierung der 5′- und 3′-Termini ohne Affinitätsreinigung. (A) Extrahierte Ionenchromatogramme ([M-1H]1–, [M-2H]2–) der ungekappten (5′ppp-AG) und gekappten (5′ cap-AG) Versionen des 5′-terminalen Oligonukleotids für BNT162b2 Variantenkonstrukte Original, Delta und Omicron. (B, C) Entfaltete Nullladungs-Massenspektren der unverkappten (5′ppp-AG) bzw. gekappten (5′ cap-AG) Versionen des 5′-terminalen Oligonukleotids für die BNT162b2-Variantenkonstrukte Original, Delta und Omicron . Die Spektren werden mithilfe von Byos v4.4 (Protein Metrics) aus der Summe der Scans innerhalb der in Panel A hervorgehobenen Regionen entfaltet. Beobachtete Massen (monoisotopisch) stimmen mit theoretischen Massen bis auf 3 ppm überein, was mit der Genauigkeit und Präzision von Orbitrap-Massenspektrometern übereinstimmt. (D) UV-Chromatogramme (260 nm) der Poly(A)-Schwanzregion für BNT162b2-Variantenkonstrukte Original, Delta und Omicron: die Poly(A)-Oligonukleotidregionen A30 und L70, bestehend aus den generischen Formeln C[A]nG und ACV[A]n, sind entsprechend gekennzeichnet. Chromatographisch getrennte A30-Poly(A)-Peaks werden entsprechend der Anzahl der in jedem Oligonukleotid nachgewiesenen Adenosine markiert. Das Sternchen (*) bezeichnet eine separate A30-Poly(A)-Oligonukleotidverteilung, die aus einer fehlenden Spaltung des A30-Poly(A)-Oligonukleotids resultiert und aus der generischen Formel CCACACCCVGGAGCVAGC[A]nG besteht. Die blaue Box hebt die chromatographische Verteilung der L70-Poly(A)-Oligonukleotide (ungetrennt) hervor, die in den Feldern (E und F) näher beschrieben werden. (E) Entfaltete Nullladungs-Massenspektren der L70-Poly(A)-Oligonukleotidverteilung aus der Summe der Scans innerhalb des in Panel (D) hervorgehobenen blau umrandeten Bereichs. Massenspektralpeaks werden entsprechend der Anzahl der in jedem L70-Poly(A)-Oligonukleotid nachgewiesenen Adenosine markiert. Das doppelte Sternchen (**) bezeichnet separate L70-Poly(A)-Oligonukleotidverteilungen, die aus dem künstlichen Abbau der L70-Poly(A)-Oligonukleotide während der Probenvorbereitung resultieren. Beobachtete Massen (monoisotopisch) stimmen mit theoretischen Massen bis auf 5 ppm überein, was mit der Genauigkeit und Präzision von Orbitrap-Massenspektrometern übereinstimmt. Bei bestimmten Arten in den L70-Poly(A)-Verteilungen traten Massenfehler von ~ 1 und 2 Da aufgrund der relativen Häufigkeit dieser Arten im Spurenbereich oder aufgrund von Signalinterferenzen durch andere Arten auf. Genauer gesagt führt ein unzureichendes Signal-Rausch-Verhältnis oder eine unzureichende Interferenz zu nicht statistischen Isotopenverteilungen, was zu Fehlern bei der Bestimmung der monoisotopischen Masse führt. (F) Extrahierte entfaltete Chromatogramme (XDCs) der ursprünglichen L70-Poly(A)-Oligonukleotidverteilung von BNT162b2, hervorgehoben in Panel (E). Die farbige Schattierung jedes Oligonukleotids in Panel (E) entspricht seinem XDC.

Der durch das DNA-Plasmid-Template kodierte Poly(A)-Schwanz von BNT162b2 Original, A30L70, besteht aus einem Abschnitt von 30 Adenosinresten (A30-Segment), gefolgt von einer 10-Nukleotid-Linkersequenz und 70 weiteren zusammenhängenden Adenosinresten (L70-Segment). Aufgrund der Transkriptionsverschiebung der IVT-T7-Polymerase27 wird mehr als eine Poly(A)-Schwanzspezies beobachtet. Die A30-Poly(A)-Verteilung wird chromatographisch mit Einzelnukleotidauflösung durch die Oligonukleotidkarte (Abb. 3D) aufgelöst und durch massenspektrometrische Profilierung bestätigt (Daten nicht gezeigt). Dies bestätigt, dass der Großteil der A30-Poly(A)-Segmentlängen in BNT162b2 Original, Delta und Omicron im Bereich von 29–33 Adenosinresten liegt.

Die Verteilung des L70-Poly(A)-Segments eluiert als einzelner breiter chromatographischer Peak. Die Oligonukleotidkarte ist speziell auf den ordnungsgemäßen MS-Nachweis größerer RNase T1-Verdauungsprodukte in diesem Segment des Chromatogramms abgestimmt, um die Verteilung der L70-Poly(A)-Spezies zu charakterisieren (Abb. 3E). Die beobachteten monoisotopischen Massen der L70-Poly(A)-Spezies wurden auf der Grundlage einer genauen Massenübereinstimmung mit den erwarteten theoretischen Massen zugeordnet. Die Oligonukleotidkartierung bestätigte, dass die meisten L70-Poly(A)-Segmentlängen im BNT162b2-Original zwischen 71 und 88 lagen. Extrahierte Nullladungschromatogramme der ursprünglichen L70-Poly(A)-Verteilung von BNT162b2 zeigen, dass eine zunehmende Elutionszeit mit einer zunehmenden Poly(A)-Länge korreliert (Abb. 3F). Somit ist die L70-Poly(A)-Länge eine echte Widerspiegelung des mRNA-Konstrukts und keine künstliche Fragmentierung, die durch Elektrospray-Ionisation im Massenspektrometer induziert wird. Darüber hinaus verfügt die Oligonukleotidkarte über die Sensitivität und Spezifität, um geringfügige Verschiebungen in der L70-Poly(A)-Verteilung aufgrund von Transkriptionsschlupf zu erkennen28: Die L70-Poly(A)-Verteilungen von Delta und Omicron sind etwas kürzer als die BNT162b2-Originalverteilung (Abb. 3E).

Die Kartierung von Oligonukleotiden erfordert in der Regel vollständige MS/MS-Fragment-Ionenleitern für eine ordnungsgemäße Identifizierung über eine Vielzahl von Sequenzlängen hinweg (2-mere bis > 20-mere). Von den 302 einzigartigen Oligonukleotidsequenzen, die durch einen RNase T1-in-silico-Verdau von BNT162b2 Original erzeugt werden, sind 220 Sequenzisomere. Diese haben die gleiche Zusammensetzung und damit die gleiche Masse wie mindestens ein anderes Oligonukleotid, und viele unterscheiden sich nur durch einen einzigen Nukleotidaustausch zwischen zwei Positionen. Zur Identifizierung von Sequenzisomeren sind qualitativ hochwertige MS/MS-Spektren erforderlich.

In der Vergangenheit wurde die Oligoribonukleotid-MS/MS-Fragmentierung mittels kollisionsinduzierter Dissoziation (CID)29,30 durchgeführt. In dieser Arbeit verwendeten wir eine aktualisierte Version der Technik, die Kollisionsdissoziation mit höherer Energie (HCD), für die Oligonukleotidkartierung. Experimentelle Studien wurden durchgeführt, um die Auswirkungen der HCD-Energie, der Oligonukleotidlänge und des Ladungszustands auf die Ionentypen der Oligonukleotidfragmente und das Ausmaß der zusammenhängenden Fragmentierung entlang des RNA-Rückgrats für eine optimale Sequenzabdeckung zu untersuchen. Im Allgemeinen waren die Fragmentierungsmuster komplex und umfassten häufig alle vier Haupttypen von 5′- (a,b,c,d) und 3′-terminalen Fragmentionen (w,x,y,z)31. Einige HCD-Spektren enthielten Fragmentionen, denen eine eindeutige identifizierende Base (-B) fehlte, und interne Fragmente, die aus mehr als einem Phosphodiesterbindungsbruch entstanden waren. Wir stellen fest, dass interne Fragmente nur von begrenztem Nutzen sind, um auf die Sequenz des mutmaßlichen Oligonukleotids zu schließen, und dass sie die Qualität der Spektren verringern, indem sie informative terminale Fragmente abbauen und interferierende Massen hinzufügen. Um die Auswirkung der HCD-Energie auf die Spektren über die gesamte Oligonukleotidkarte zu beurteilen, wurde die Sequenzabdeckung des mRNA-Konstrukts überwacht. Die festen HCD-Energien 17, 21 und 25 waren optimal (Abb. 4A) in einer Reihe fester HCD-MS/MS-Aufnahmen mit einer einzelnen Energie. Die höchste Abdeckung der mRNA-Konstruktsequenzen wurde durch Kombination dieser in einer schrittweisen HCD 17, 21, 25-Methode erzielt.

Optimale HCD-Energie und Ladungsdichte sorgen für eine ordnungsgemäße Fragmentierung. (A) Relative BNT162b2 Ursprüngliche maximale Sequenzabdeckung, bestimmt durch Oligonukleotidkartierung als Funktion der HCD-Energie. Die aus jeder Bedingung resultierende maximale Sequenzabdeckung wird auf die endgültige empfohlene Bedingung normalisiert (gestufte HCD 17, 21, 25). Die maximale Sequenzabdeckung war nur auf Oligonukleotide beschränkt, die von BioPharma Finder unter Verwendung einer Konfidenz-Score-Parameterbeschränkung von 100 % identifiziert wurden. (B) MS/MS-Spektren und Fragmentionenabdeckung von 3 Oligonukleotiden, dargestellt als Funktion der HCD-Energie und der Oligonukleotidlänge. Die MS/MS-Spektren werden unter Verwendung der HCD-Energien 13, 21, 33 und 45 erzeugt, angewendet auf 7mer-, 14mer- und 21mer-Oligonukleotide. Als 5′ (a,b,c,d), 3′ (w,x,y,z) identifizierte Fragmentionen und interne Fragmente werden durch Farbcodierung gemäß der Definition im Schlüssel kommentiert. Die Identifizierung und Annotation von Fragmentionen wurde mit einem selbst entwickelten Visual Basic Excel-Tool durchgeführt. (C) MS/MS-Spektren und Fragmentionenabdeckung von 3 Oligonukleotiden, dargestellt als Funktion der Oligonukleotidladung und -länge. MS/MS-Spektren werden unter Verwendung einer HCD-Methode mit einstufiger Energie (17, 21, 25) für niedrige, mittlere und hohe Ladungszustände derselben 7mer-, 14mer- und 21mer-Oligonukleotide erzeugt, die in Panel B dargestellt sind. Fragmentionen, identifiziert als 5‘ (a,b,c,d), 3′ (w,x,y,z) und interne Fragmente werden durch Farbcodierung gemäß Definition im Schlüssel kommentiert. Die Identifizierung und Annotation von Fragmentionen wurde mit einem selbst entwickelten Visual Basic Excel-Tool durchgeführt.

Diese Ergebnisse werden insbesondere durch die Untersuchung der in MS/MS-Spektren erzeugten Fragmentionenabdeckung als Funktion der HCD-Energie und der Oligonukleotidlänge verstanden (Abb. 4B). Die Ionenladungsdichten der Oligonukleotidfragmente wurden in diesem Beispiel für alle Spektren konstant gehalten: 2,3 Nukleotide pro Ladung. Massenspektren kürzerer Oligonukleotide enthielten typischerweise eine vollständige Palette erkennbarer Fragmentionen, unabhängig von der HCD-Energie. Die HCD-Energie hatte einen größeren Einfluss auf längere Oligonukleotide; Niedrigere Energien erzeugten keine ausreichenden Mengen an produktiven Fragmentionen für die Sequenzierung. Wenn die HCD-Energie erhöht wird, nehmen die für die Sequenzierung geeigneten 5′- (a, b, c, d) und 3′-terminalen Fragmentionen (w, x, y, z) zu. Die HCD-Energie korreliert positiv mit der Häufigkeit interner Fragmentionen, sodass eine HCD-Energie über 25 nicht empfohlen wird. Die Sequenzunterscheidung geht ab der Mitte der Oligonukleotide verloren, wenn längere terminale Fragmente weiter in interne Fragmente fragmentiert werden. Dieser Trend setzt sich fort, wenn die HCD-Energie zunimmt und nur die kürzesten Oligonukleotide übrig bleiben, von denen einige kurze terminale Fragmente sind. Eine HCD-Energie von 21 erzeugte ein ideales Gleichgewicht relativ häufiger terminaler Fragmentionen zur Sequenzierung und Abschwächung der internen Fragmentierung.

Die MS/MS-Fragment-Ionenabdeckung wurde auch als Funktion des Ladungszustands und der Oligonukleotidlänge untersucht (Abb. 4C). Die HCD-Energie wird bei der empfohlenen Bedingung der abgestuften HCD-Kollisionsenergien konstant gehalten: 17, 21, 25. Für alle Oligonukleotidlängen erzeugten die niedrigsten Ladungszustände im Allgemeinen die geringste Fragmentionenabdeckung und die höchsten Ladungszustände erzeugten im Allgemeinen das höchste Fragmention Abdeckung. Fragmentionen aus einem Vorläufer mit niedrigerem Ladungszustand können in einigen Fällen aus zwei Hauptgründen eine zusätzliche Sequenzabdeckung an einer bestimmten Position ermöglichen: (1) der höhere Ladungszustand hat eine deutlich geringere Häufigkeit als ein niedrigerer Ladungszustand und/oder (2) höher- Geladene Fragmentionen überlappen sich mit niedriger geladenen Fragmentionen, wodurch die Identität beider verwechselt wird.

Wir beobachteten, dass eine Erhöhung der Oligonukleotid-Ladungsdichte einen positiven Effekt auf die sequenzierungsermöglichende Fragmentierung hatte. Beispielsweise erzeugt der [M-4H]-4-Ladungszustand des 7-mers (1,75 Nukleotide/Ladung) reichlich Fragmentionen und eine vollständige Fragmentionenabdeckung (Abb. 4C). Allerdings erzeugt der [M-4H]-4-Ladungszustand des 21-mers (5,25 Nukleotide/Ladung) relativ schwache Fragmentionen, sodass nur die Sequenzierung der ersten paar Nukleotide an jedem Terminus möglich ist. Dieses Phänomen ist mit zunehmender Oligonukleotidlänge am ausgeprägtesten. Die MS/MS-Sequenzierung von Oligonukleotiden mit Ladungsdichten < ~ 2,5 kombiniert mit abgestuftem HCD 17, 21, 25 sorgte für eine geeignete Fragmentierung über die Oligonukleotidkarte. Glücklicherweise erzeugen IP-RP-UHPLC-ESI-MS-Bedingungen zunehmend höhere Ladungszustände mit später eluierenden größeren Oligonukleotiden; Dadurch bleibt die ideale Ladungsdichte für die MS/MS-Sequenzierung erhalten. Typischerweise brachte die MS/MS-Sequenzierung zweier unterschiedlicher Ladungszustände desselben Oligonukleotids nur einen geringen Mehrwert.

Eine optimale HCD-Fragmentierung ermöglichte die erfolgreiche Differenzierung nahezu aller Sequenzisomere in der Oligonukleotidkarte. Abbildung 5 zeigt dies anhand eines herausfordernden, aber häufigen Szenarios. Drei Sequenzisomere sind in einem extrahierten Ionenchromatogramm abgebildet (Abb. 5A). Isomer „2“, das nach 75 Minuten eluiert, koeluiert mit anderen Oligonukleotiden mit sehr ähnlicher Masse (Abb. 4C), was das Risiko der Isolierung zweier nicht verwandter Oligonukleotide erhöht, um ein gemischtes MS/MS-Spektrum zu erzeugen. Die Oligonukleotidkarte verwendet ein MS/MS-Isolierungsfenster (1,5 m/z), das die Notwendigkeit ausgleicht, das Auftreten gemischter Spektren (Abb. 5B und C) zu minimieren und die Isotopenverteilung abzutasten, um die Bestimmung des Ladungszustands der Fragmentionen zu ermöglichen. Die Sequenzisomere „1“ und „2“ sind sehr ähnlich und unterscheiden sich nur durch einen einzigen Austausch des 3. und 6. Nukleotids (Abb. 5C). Daher sind ihre MS/MS-Spektren sehr ähnlich, aber einige Schlüsselfragmentionen unterscheiden jedes Sequenzisomer.

Die ordnungsgemäße MS/MS-Fragmentierung und -Interpretation ist für die Oligonukleotidkartierung von entscheidender Bedeutung. (A) Extrahiertes Ionenchromatogramm von 3 Oligonukleotidsequenzisomeren ([M-4H]4−). (B) Vollständige Scan-Massenspektren der Sequenzisomere „1“ und „2“ ([M-4H]4−), wie in Panel (A) angegeben. Die blaue Schattierung definiert das Vorläufer-Isolationsfenster, das für die nachfolgende MS/MS-Fragmentierung verwendet wird. (C) MS/MS-Fragmentierungsspektren, abgeleitet von den Sequenzisomeren „1“ und „2“ ([M-4H]4−). (D) Vergrößerte Abschnitte der Sequenzisomere „1“ und „2“ ([M-4H]4−) in MS/MS-Spektren, mit Anmerkungen zu ausgewählten 5′- und 3′-Fragmentionen. Die 1., 2. und 3. Spalte im Bereich der beobachteten 5′-MS/MS-Fragmente (oben) heben 5′-Fragmente hervor, die für die Positionen 2, 3 bzw. 6 identifiziert wurden. Die 1., 2. und 3. Spalte im Bereich der beobachteten 3′-MS/MS-Fragmente (unten) heben 3′-Fragmente hervor, die für die Positionen 1, 2 bzw. 5 identifiziert wurden. Für jedes Panel bedeutet die Bezeichnung „divergent“, dass die Massen der gleichen Fragmentionen zwischen den Sequenzisomeren „1“ und „2“ an dieser Position divergieren, was darauf hinweist, dass sie an dieser Position unterschiedliche Nukleotide enthalten. Die Bezeichnung „konvergent“ bedeutet, dass die Massen der gleichen Fragmentionen zwischen den Sequenzisomeren „1“ und „2“ an dieser Position konvergieren, was wiederum darauf hinweist, dass sie an dieser Position unterschiedliche Nukleotide enthalten. Die Farbkodierung der spektralen Peaks ist im Schlüssel definiert. Die eindeutige Farbschattierung jedes Pfeils, der Fragmentionen hervorhebt, entspricht den Farben, wie in Tafel (E) definiert. (E) Beobachtete Fragmentionenmassentabellen für die Sequenzisomere „1“ und „2“ ([M-4H]4−). Eine eindeutige Farbschattierung definiert jeden Typ von 5‘-Fragment-Ionen und sein 3‘-Paar und entspricht den schattierten Pfeilen in Tafel (D). Die dunkelblaue Schattierung hebt die beiden Basen hervor, die zwischen den beiden Sequenzisomeren ihre Position ändern. Die graue Schattierung hebt die Fragmentionenmassen hervor, die die beiden Sequenzisomere voneinander unterscheiden.

Ab dem 5′-Ende (Abb. 5D und E) haben terminale Fragmentionen, die an den Positionen 1 und 2 enden, für jedes Sequenzisomer identische Massen. Terminale Fragmentionen, die an Position 3–5 enden, weisen in jedem Sequenzisomer eindeutige, unterschiedliche Massen auf, was auf einen Unterschied in der Sequenz an Position 3 hinweist. Terminale Fragmentionen, die an Position 6 enden, konvergieren in der Masse, was auf einen weiteren Unterschied in der Sequenz zwischen Sequenzisomeren an Position 6 hinweist .

Ab dem 3′-Ende (Abb. 5D und E) haben terminale Fragmentionen an Position 1 für jedes Sequenzisomer identische Massen. Terminale Fragmentionen, die an Position 2–4 enden, weisen für jedes Sequenzisomer eindeutige Massen auf, was auf einen Unterschied in der Sequenz an Position 2 hinweist. Terminale Fragmentionen, die an Position 5 enden, konvergieren in der Masse, was auf einen weiteren Unterschied zwischen Sequenzisomeren in der Sequenz an Position 5 hinweist.

In beiden Fällen ist die Erkennung von Sequenzunterschieden davon abhängig, dass eine vollständige Fragment-Ionenleiter vorhanden ist. Die MS/MS-Fragmentierung durch Oligonukleotidkartierung erzeugte für die meisten Sequenzisomere vollständige komplementäre Fragmentionenleitern, was ihre eindeutige Identifizierung ermöglichte und die Eignung der Parameter für die Oligonukleotidkartierung bezeugte.

Eine umfassende, hochpräzise Analyse von Oligonukleotid-Kartierungsdaten erfordert Automatisierung für praktische Benutzerfreundlichkeit und Effizienz. Zur Automatisierung der Datenanalyse der Oligonukleotidkartierung wurden firmeneigene Excel Visual Basic for Applications (VBA)-Skripte in Kombination mit in der Entwicklung befindlicher Beta- und kommerzieller Anbietersoftware verwendet. Zusammen ermöglichten diese Tools eine umfassende Charakterisierung der Primärstruktur von BNT162b2 Original mittels Oligonukleotidkartierung mit vollständiger UV-Peak-Annotation und 100 % maximaler Sequenzabdeckung.

Ein benutzerdefiniertes Excel-VBA-Skript korrelierte automatisch die durch LC-MS/MS identifizierten Oligonukleotide mit ihrem entsprechenden LC-UV-Merkmal und versehene das gesamte UV-Chromatogramm automatisch mit Anmerkungen (Ergänzungsdaten Abb. 6 veranschaulicht den gesamten Arbeitsablauf). Die Identifizierung erfolgte mit einer von zwei Methoden: (1) 280 von 388 (72 %) Oligonukleotiden wurden mit BioPharma Finder (Thermo Fisher Scientific) identifiziert, (2) 108 von 388 (28 %) wurden mit benutzerdefinierten Excel-VBA-Skripten identifiziert. Die Skripte erleichterten die halbautomatische Oligonukleotididentifizierung durch das folgende Verfahren: (1) beobachtete Vorläufermassen, die mit nicht identifizierten LC-UV-Merkmalen assoziiert waren, wurden möglichen theoretischen Verdau-Oligonukleotiden zugeordnet, (2) für jeden unbekannten, empirischen MS/MS-m/z-Peak Intensitätskoordinaten, beobachtete Masse, Ladungszustand und ein hypothetisches Oligonukleotid aus der Kandidatenliste wurden in einen MS/MS-Spektrumanalysator eingegeben, (3) ein annotiertes MS/MS-Spektrum und eine entsprechende Sequenzierungstabelle wurden automatisch generiert, (4) das MS/MS-Spektrum Die Übereinstimmung der MS-Sequenzierung mit dem vermuteten Oligonukleotid wurde von einem Analysten überprüft und die Identifizierung bestätigt oder abgelehnt.

Die Analyse von Oligonukleotid-Kartierungsdaten wird durch die Fülle an Sequenzisomeren mit sehr ähnlichen MS/MS-Spektren erschwert. Es besteht auch eine hohe Wahrscheinlichkeit, dass viele der RNase T1-Verdauungsprodukte für ein großes (z. B. ~ 1 + MDa) Zielkonstrukt identische Massen und eine hohe Sequenzähnlichkeit mit den Verdauungsprodukten anderer Konstrukte mit ähnlicher Größe und Zusammensetzung aufweisen. Beispielsweise weist die Rückwärtssequenz von BNT162b2 die gleiche Anzahl an In-silico-RNase-T1-Verdauprodukten auf wie die Vorwärtssequenz; aber nur 26 % von ihnen haben die gleiche Sequenz (Abb. 6A). Allerdings haben 99 % die gleiche Masse (Abb. 6B), weshalb eine qualitativ hochwertige MS/MS und eine genaue Interpretation dieser Spektren für ihre Identifizierung und die Identifizierung des richtigen Konstrukts von entscheidender Bedeutung sind.

Die Suchtechnik für Lockvogelsequenzen wurde als Eignungsbewertung für den Oligonukleotid-Mapping-Workflow entwickelt. (A) Venn-Diagramm der gemeinsamen und einzigartigen Oligonukleotidfragmente eines theoretischen RNase-T1-Verdaus des BNT162b2-Originalkonstrukts und seines Reverse-Sequenz-Konstrukts. Dies ist ein Beispiel für ein Täuschungskonstrukt. Der theoretische Verdau sagt 302 Oligonukleotide mit eindeutiger Sequenz (74 %) für jedes und 78 gemeinsame Oligonukleotide (26 %) voraus. (B) Venn-Diagramm der Oligonukleotidfragmente mit gemeinsamer Masse und einzigartiger Masse eines theoretischen RNase-T1-Verdaus des BNT162b2-Originalkonstrukts und seines Reservesequenzkonstrukts. Der theoretische Verdau sagt jeweils 147 Oligonukleotide mit einzigartiger Masse voraus. Davon sind 145 Oligonukleotide (99 %) gemeinsam. (C) Überlagerung zur Identifizierung des Täuschungskonstrukts auf dem Basispeak-Ionenchromatogramm der BNT162b2-Original-RNase-T1-Verdau-Erfassung. Jeder farbige Balken markiert ein Oligonukleotidmerkmal, das von der automatisierten Software BioPharma Finder als aus dem RNase T1-Verdau eines Täuschungskonstrukts stammend identifiziert wurde. Die Täuschungskonstrukte sind Zufallssequenzen, die die Nukleotidzusammensetzung von BNT162b2 Original enthalten. Die gemeinsame Sequenz-Elutionsregion enthält kürzere Oligonukleotide, von denen die meisten allen Täuschungskonstrukten sowie dem echten Konstrukt gemeinsam sind, wenn es einem RNaseT1-Verdau unterzogen wird. Die einzigartige Sequenz-Elutionsregion enthält längere Oligonukleotide, von denen die meisten nur für das wahre Konstrukt gelten. Die echten Konstrukt-Oligonukleotide sind ähnlich genug, um Oligonukleotide mit Täuschungssequenz zu erkennen, damit die automatisierte Software Täuschungs-Oligonukleotid-Zuordnungen bereitstellen kann. Die Identifizierungen in der einzigartigen Sequenz-Elutionsregion werden nicht vorzugsweise einem einzelnen Täuschungskonstrukt zugeordnet, was zeigt, dass keines der Täuschungskonstrukte das wahre Konstrukt ist. (D) Überlagerung der Identifizierung von Ziel- und Täuschungskonstrukten auf dem Basispeak-Ionenchromatogramm der BNT162b2-Original-RNase-T1-Verdau-Erfassung. Jeder farbige Balken markiert ein Oligonukleotidmerkmal, das von der automatisierten Software BioPharma Finder als aus dem RNase T1-Verdau eines Lock- oder Zielkonstrukts stammend identifiziert wurde. Oligonukleotide in der einzigartigen Sequenz-Elutionsregion werden größtenteils (> 95 %) als zum BNT162b2-Originalkonstrukt gehörend identifiziert. Dies bestätigt die Identität des wahren Konstrukts und verifiziert die Fähigkeit des Oligonukleotid-Mapping-Workflows, Oligonukleotide mittels LC-MS/MS korrekt zu identifizieren.

Aufgrund dieser Herausforderung ist eine umfassende Eignungsbewertung für die automatisierte Oligonukleotiddatenanalyse erforderlich. Der erste Schritt der Strategie verdeutlicht auch das inhärente Problem. Die automatisierte Identifizierung von BNT162b2-Oligonukleotiden wird anhand von Täuschungskonstrukten durchgeführt, die durch zufälliges Verwürfeln der Sequenz erzeugt wurden (Abb. 6C). Die meisten Oligonukleotide, die in der „einzigartigen Sequenzregion“ eluieren, können nur durch RNase T1-Verdau des echten Konstrukts erzeugt werden, im Gegensatz zu den Oligonukleotiden der „gemeinsamen Sequenzregion“, die bei In-silico-Verdaus des wahren Konstrukts und eines oder mehrerer Täuschungskonstrukte üblich sind . Viele einzigartige Oligonukleotide ähneln in silico RNase T1-Verdau-Oligonukleotiden eines oder mehrerer Täuschungskonstrukte, sodass die Software gewissenhaft eine Identifizierung zuweist (wenn auch falsch). Dies geschieht, weil das MS-Vorläuferionen-Übereinstimmungskriterium erfüllt ist und genügend MS/MS-Beweise vorliegen, die eine vernünftige Sequenzidentifizierung unterstützen. Wichtig ist, dass das Weglassen des BNT162b2-Konstrukts aus der Täuschungssuche (Abb. 6C) dazu führt, dass Oligonukleotide einer vergleichbaren Mischung aller drei Täuschungskonstrukte zugeordnet werden. Im Gegensatz dazu werden die meisten Oligonukleotide in der „einzigartigen Sequenzregion“ dem BNT162b2-Konstrukt zugeordnet, wenn zusammen mit den Täuschungskonstrukten durchsucht wird, was zeigt, dass es sich um das wahre Konstrukt handelt (Abb. 6D). Diese Auslesung ist eine Bestätigung dafür, dass der kombinierte Arbeitsablauf aus (1) enzymatischer Ein-Topf-Ein-Enzym-Verdauung, (2) chromatographischer Trennung, (3) MS/MS-HCD-Fragmentierung und (4) halbautomatischer Datenanalyse für mRNA geeignet ist Charakterisierung der Primärstruktur.

Während die in dieser Studie verwendete automatisierte Software, BioPharma Finder, eine umfassende Überprüfung der Wiedergabetreue durch Täuschungssuche ermöglicht, liefert sie für einzelne MS/MS-Übereinstimmungen weder eine Rangfolge der besten und nächstbesten Übereinstimmungen noch eine aus der Konfidenzbewertung abgeleitete Übereinstimmungswahrscheinlichkeit. Zur Gegenprüfung einzelner MS/MS-Zuordnungen haben wir auch das öffentlich verfügbare Pytheas-Softwarepaket32 verwendet. Bei diesem Vergleich war es nicht möglich, Übereinstimmungen einzelner Fragmentspektren zwischen Software zu finden; Stattdessen wurden die Retentionszeiten der Identifizierungen gleicher Oligonukleotide verglichen. Die Retentionszeiten stimmen nicht perfekt überein, da Pytheas nur MS/MS interpretiert, sodass die Retentionszeit einer Identifizierung auf der Ereigniszeit ihres MS/MS-Scans basiert, während BioPharma Finder Vorläuferionenchromatogramme extrahiert und eine MS/MS-Identifikation damit verknüpft die Apex-Retentionszeit des vom Vorläufer extrahierten Ions. Dennoch beweisen der Korrelationskoeffizient von 0,9997 und die Steigung von 0,9993 der linearen Anpassung an das Diagramm der Retentionszeiten (Pytheas, BioPharma Finder) der 280 mit BioPharma Finder identifizierten Oligonukleotide, dass beide Softwareprogramme mit nahezu allen Oligonukleotididentifizierungen übereinstimmen (Supplementary Data Abb. 7). Diese Analyse wirft eine wichtige Beobachtung auf: Wenn LC-Merkmale nicht aus Sequenzisomeren bestehen, identifizieren BioPharma Finder und die automatisierte Software Pytheas Oligonukleotide gleichermaßen gut. Wenn es sich bei LC-Merkmalen um Mischungspeaks von Sequenzisomeren handelt, kann keine Software die Oligonukleotide gut identifizieren (das Merkmal ist entweder nicht identifiziert (BioPharma Finder) oder falsch identifiziert (Pytheas)), und der Analyst muss die Identifizierung durch sorgfältige Spektruminterpretation mithilfe individueller Spektrum-Matching-Software wie z wie die in dieser Studie bereitgestellten makrofähigen Excel-Tabellen.

Die LC-MS/MS-Oligonukleotidkartierung wurde entwickelt, um eine direkte und umfassende Charakterisierung der mRNA-Primärstruktur für den Comirnaty BNT162b2-Impfstoff gegen SARS-CoV-2 zu ermöglichen. Unter Verwendung eines Enzyms, RNase T1, erreichte die Methode eine maximale Sequenzabdeckung von 100 % und einen empfindlichen Nachweis der 5′- und 3′-terminalen Formen und bestätigte so die strukturelle Integrität des beabsichtigten Moleküls voller Länge in einer einzigen Methode. Die Anzahl der Oligonukleotidsequenzwiederholungen in mRNA ist nach dem RNase-T1-Verdau vorherrschend, aber die Methode hat diese Spezies stöchiometrisch verdaut und nachgewiesen, was die Abdeckung einzigartiger Sequenzen um 56 % erhöht. Die systematische Auswertung der MS/MS-Parameter führte zu einer zuverlässigen Differenzierung von Sequenzisomeren, die auch in verdauter mRNA vorherrschen, und sorgte so für eine weitere Steigerung der maximalen Sequenzabdeckung. Schließlich wurde eine Suchtechnik zur Analyse von Täuschungssequenzdaten entwickelt, um das Vertrauen in die automatisierte Oligonukleotidzuordnung sicherzustellen. Insgesamt verbessert die hier beschriebene LC-MS/MS-Oligonukleotid-Kartierungsmethode bestehende Methoden, indem sie (1) eine robuste, kommerziell erhältliche Eintopf-Nuklease-Verdauungsmethode bereitstellt; (2) Sicherstellen, dass die sequenzierungsinformativsten MS/MS mithilfe einer optimierten HCD-Fragmentierung erfasst werden; (3) Bereitstellung einer einfachen Eignungsbewertung für die Täuschungssuche, um sicherzustellen, dass automatisierte Software MS/MS richtig interpretiert; (4) Bereitstellung eines Tools zur ordnungsgemäßen Annotation des „Fingerprint“-Komplex-LC-UV-Chromatogramms und (5) Bereitstellung von MS- und MS/MS-Spektrum-Interpretationstools zur Überprüfung automatisierter Software-Identifikationen und zur Identifizierung unbekannter Peaks und Sequenzisomermischungspeaks.

Wir empfehlen eine praktische Eignungsbewertung zur Bewertung des gesamten LC-MS/MS-Workflows, einschließlich der automatisierten Datenanalyse (Abb. 6C und D). Diese Täuschungssuchstrategie ist analog zu dem, was seit langem für die Proteininferenz in proteomischen Analysen durchgeführt wird33. Diese Oligonukleotid-Kartierungsmethode ist keine „-omics“-Methode; Unabhängig von der Heterogenität der 3′- und 5′-Enden ist DS ein einzelnes Konstrukt und keine komplexe Mischung aus Tausenden von RNA-Molekülen. Dennoch ist eine Täuschungssuche, die eine Bewertung der MS/MS-Übereinstimmungsqualität durch relativen Spektralvergleich ermöglicht, angemessen, da Sequenzisomere aus demselben Konstrukt sehr ähnliche Fragmentierungsmuster aufweisen können – und es gibt viele Sequenzisomere: 220 der 302 BNT162b2-mRNA-theoretischen RNase T1 Oligonukleotide verdauen.

Ein weiterer vielversprechender Aspekt dieses MS-Ansatzes besteht darin, dass durch die direkte Charakterisierung von RNA auch Phosphodiester-Hydrolyse-Abbaustellen und unvollständige Transkriptionsstellen katalogisiert und anschließend überwacht werden können, um die DS-Abbauwege zu verstehen. Darüber hinaus ist es möglich, Oligonukleotide nachzuweisen, die aus der Transkription der Nicht-Zielregion des DNA-Plasmids entstehen (obwohl dies in dieser Studie nicht beobachtet wurde). Schließlich könnte diese Oligonukleotid-Kartierungsmethode weiter optimiert und zur Charakterisierung ortsspezifischer Modifikationen, einschließlich mRNA-Lipid-Addukten34 und anderer möglicher Effekte, angewendet werden.

Es gibt andere gute Strategien, um die Anzahl einzigartiger Oligonokleotide in der RNA-Karte zu erhöhen, indem entweder RNase T1-fehlende Spaltungen bei einem begrenzten Verdau gefördert werden oder Endonukleasen mit Substratstellen mit geringer Häufigkeit, wie MazF und RNase 418,19,35, verwendet werden. Die hier beschriebene Datenanalysemethode sollte genauso gut funktionieren und kann darüber hinaus erforderlich sein, da die Identifizierung von Gemisch-Peak-Komponenten unabhängig von der Einzigartigkeit des Oligonukleotids ein Problem darstellt (obwohl es weniger Gemisch-Peaks geben sollte).

Oligonukleotidkartierung und Next-Generation Sequencing (NGS) sind leistungsstarke, orthogonale Charakterisierungsmethoden zur Bestimmung der mRNA-Primärstruktur. Beide Techniken haben deutliche Vorteile. NGS kann die zusammenhängende Nukleotidsequenz mit mehreren Lesevorgängen effektiv bestimmen (Supplementary Data Abb. 8) sowie kontaminierende DNA/RNA erkennen und identifizieren. Die Oligonukleotidkartierung wird verwendet, um die strukturelle Integrität des gesamten mRNA-Moleküls einschließlich der Nukleotidsequenz, des Grades des verkappten und nicht verkappten 5′-Terminus und der Mikroheterogenität der Poly(A)-Schwanzregion zu bestätigen. Darüber hinaus bietet es eine wichtige Möglichkeit, die Vergleichbarkeit von Chargen nach Änderungen im Herstellungsprozess und am Standort zu beurteilen. Es kann zur Unterscheidung verschiedener mRNA-Konstrukte als Identitätstest verwendet werden. Es müssen keine methodenspezifischen Kontrollen synthetisiert und gepflegt werden (z. B. mit schweren Isotopen markierte Kontrollen).

Die hier beschriebene Oligonukleotid-Kartierungsmethode, die einen 1,5-stündigen RNase-T1-Verdau und IP-RP-UHPLC-UV-MS/MS umfasst, wurde bei der Entwicklung und Vermarktung des Comirnaty BNT162b2-Impfstoffs gegen SARS-CoV-2 verwendet. Das durch die Oligonukleotidkartierung gewonnene Prozess- und Produktverständnis unterstützte sowohl die behördlichen Einreichungen zur Notfallgenehmigung (EUA) als auch zur Biologikalizenz (BLA) und trug zur Gesamtbewertung der Produktqualität, -sicherheit und -wirksamkeit bei. Ebenso war die Kartierung von Oligonukleotiden Teil vieler Vergleichsuntersuchungen, um zu zeigen, dass die höchste Produktqualität beibehalten wurde, als der Produktionsumfang erhöht und neue Produktionsstandorte in Betrieb genommen wurden, um den kritischen Versorgungsproblemen der COVID-19-Pandemie gerecht zu werden. Mit dieser Methode wollen wir die Entwicklung und Zulassungsanträge gut charakterisierter mRNA-Impfstoffe und Gentherapien beschleunigen und die Wissenschaft des RNA-Strukturverständnisses im weiteren Sinne vorantreiben.

Rohdaten und ein detailliertes Methodendokument werden auf der Dryad Data Platform bereitgestellt: https://datadryad.org/stash/share/38WoZ944MVcISX-VQpGNoaXn_4Pwe5nv_ipD707TZF8.

Auf der Dryad-Datenplattform stehen vier Excel VBA-Software-Mapping- und Identifizierungstools zur Überprüfung und Erweiterung der Thermo BioPharma Finder-Identifizierungen sowie zur Bereitstellung eines kommentierten Chromatogramms zur Verfügung: https://datadryad.org/stash/share/38WoZ944MVcISX-VQpGNoaXn_4Pwe5nv_ipD707TZF8. Das bereitgestellte Methodendokument beschreibt auch die Klick-für-Klick-Anweisungen für die Verwendung der einzelnen XLSM-Dateien.

Die analysierten mRNA-Konstrukte wurden bei Pfizer hergestellt. Obwohl die Sequenzen in diesem Manuskript bereitgestellt werden, ist es nicht möglich, das hier präsentierte mRNA-Material zur Verfügung zu stellen.

Lamb, YN BNT162b2 mRNA-COVID-19-Impfstoff: Erste Zulassung. Drogen 81, 495–501. https://doi.org/10.1007/s40265-021-01480-7 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Baden, LR et al. Wirksamkeit und Sicherheit des mRNA-1273 SARS-CoV-2-Impfstoffs. N. engl. J. Med. 384, 403–416. https://doi.org/10.1056/NEJMoa2035389 (2020).

Artikel PubMed Google Scholar

Zheng, J. SARS-CoV-2: Ein neu auftretendes Coronavirus, das eine globale Bedrohung darstellt. Int. J. Biol. Wissenschaft. 16, 1678–1685. https://doi.org/10.7150/ijbs.45053 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Sahin, U., Karikó, K. & Türeci, Ö. mRNA-basierte Therapeutika – Entwicklung einer neuen Medikamentenklasse. Nat. Rev. Drug Discov. 13, 759–780. https://doi.org/10.1038/nrd4278 (2014).

Artikel CAS PubMed Google Scholar

Xia, X. Detaillierte Analyse und kritische Bewertung der mRNA-Impfstoffe von Pfizer/BioNTech und Moderna. Impfstoffe 9, 734 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Wrapp, D. et al. Kryo-EM-Struktur des 2019-nCoV-Spikes in der Präfusionskonformation. Wissenschaft 367, 1260–1263. https://doi.org/10.1126/science.abb2507 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Jackson, NAC, Kester, KE, Casimiro, D., Gurunathan, S. & DeRosa, F. Das Versprechen von mRNA-Impfstoffen: Eine biotechnologische und industrielle Perspektive. NPJ Vaccines 5, 11. https://doi.org/10.1038/s41541-020-0159-8 (2020).

Artikel PubMed PubMed Central Google Scholar

Topisirovic, I., Svitkin, YV, Sonenberg, N. & Shatkin, AJ Cap und Cap-bindende Proteine ​​bei der Kontrolle der Genexpression. Wiley Interdisziplinär. Rev. RNA 2, 277–298. https://doi.org/10.1002/wrna.52 (2011).

Artikel CAS PubMed Google Scholar

Aitken, CE & Lorsch, JR Ein mechanistischer Überblick über die Translationsinitiierung in Eukaryoten. Nat. Struktur. Mol. Biol. 19, 568–576. https://doi.org/10.1038/nsmb.2303 (2012).

Artikel CAS PubMed Google Scholar

Shatkin, AJ Capping eukaryontischer mRNAs. Zelle 9, 645–653. https://doi.org/10.1016/0092-8674(76)90128-8 (1976).

Artikel CAS PubMed Google Scholar

Furuichi, Y., LaFiandra, A. & Shatkin, AJ 5'-terminale Struktur und mRNA-Stabilität. Natur 266, 235–239. https://doi.org/10.1038/266235a0 (1977).

Artikel ADS CAS PubMed Google Scholar

Geisberg, JV, Moqtaderi, Z., Fan, X., Ozsolak, F. & Struhl, K. Die globale Analyse der mRNA-Isoformen-Halbwertszeiten zeigt stabilisierende und destabilisierende Elemente in Hefe. Zelle 156, 812–824. https://doi.org/10.1016/j.cell.2013.12.026 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Fountain, KJ, Gilar, M. & Gebler, JC Analyse nativer und chemisch modifizierter Oligonukleotide durch Tandem-Ionenpaar-Umkehrphasen-Hochleistungsflüssigkeitschromatographie/Elektrospray-Ionisations-Massenspektrometrie. Schnelle Kommuni. Massenspektrometer. 17, 646–653. https://doi.org/10.1002/rcm.959 (2003).

Artikel ADS CAS PubMed Google Scholar

Zhang, G., Lin, J., Srinivasan, K., Kavetskaia, O. & Duncan, JN Strategien zur Bioanalyse eines Makromoleküls der Oligonukleotidklasse aus Rattenplasma mittels Flüssigkeitschromatographie-Tandem-Massenspektrometrie. Anal. Chem. 79, 3416–3424. https://doi.org/10.1021/ac0618674 (2007).

Artikel CAS PubMed Google Scholar

Deng, P., Chen, X., Zhang, G. & Zhong, D. Bioanalyse eines Oligonukleotids und seiner Metaboliten durch Flüssigkeitschromatographie-Tandem-Massenspektrometrie. J. Pharm. Biomed. Anal. 52, 571–579. https://doi.org/10.1016/j.jpba.2010.01.040 (2010).

Artikel CAS PubMed Google Scholar

Beverly, M., Dell, A., Parmar, P. & Houghton, L. Markierungsfreie Analyse der mRNA-Capping-Effizienz unter Verwendung von RNase H-Sonden und LC-MS. Anal. Bioanal. Chem. 408, 5021–5030. https://doi.org/10.1007/s00216-016-9605-x (2016).

Artikel CAS PubMed Google Scholar

Beverly, M., Hagen, C. & Slack, O. Poly-A-Schwanzlängenanalyse von in vitro transkribierter mRNA mittels LC-MS. Anal. Bioanal. Chem. 410, 1667–1677. https://doi.org/10.1007/s00216-017-0840-6 (2018).

Artikel CAS PubMed Google Scholar

Vanhinsbergh, CJ et al. Charakterisierung und Sequenzkartierung großer RNA- und mRNA-Therapeutika mittels Massenspektrometrie. Anal. Chem. 94, 7339–7349. https://doi.org/10.1021/acs.analchem.2c00765 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Jiang, T. et al. Kartierung der Oligonukleotidsequenz großer therapeutischer mRNAs mittels paralleler Ribonukleaseverdaus und LC-MS/MS. Anal. Chem. 91, 8500–8506. https://doi.org/10.1021/acs.analchem.9b01664 (2019).

Artikel CAS PubMed Google Scholar

Nakayama, H., Nobe, Y., Koike, M. & Taoka, M. Flüssigchromatographie-Massenspektrometrie-basierte qualitative Profilierung von mRNA-Therapeutika unter Verwendung stabil isotopenmarkierter Standards, gefolgt von der automatischen Quantifizierungssoftware Ariadne. Anal. Chem. 95, 1366–1375. https://doi.org/10.1021/acs.analchem.2c04323 (2023).

Artikel CAS PubMed Google Scholar

Nwokeoji, AO, Earll, ME, Kilby, PM, Portwood, DE & Dickman, MJ Hochauflösendes Fingerprinting von einzel- und doppelsträngiger RNA mittels Ionenpaar-Umkehrphasenchromatographie. J. Chromatogr. B Analyt. Technol. Biomed. Lebenswissenschaft. 1104, 212–219. https://doi.org/10.1016/j.jchromb.2018.11.027 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Wolf, EJ et al. Humane RNase 4 verbessert die mRNA-Sequenzcharakterisierung durch LC-MS/MS. Nukleinsäuren Res. 50, e106. https://doi.org/10.1093/nar/gkac632 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Lewis, LM, Badkar, AV, Cirelli, D., Combs, R. & Lerch, TF Der Wettlauf um die Entwicklung des Pfizer-BioNTech-COVID-19-Impfstoffs: Aus der Sicht der Pharmawissenschaftler. J. Pharm. Wissenschaft. https://doi.org/10.1016/j.xphs.2022.09.014 (2022).

Artikel PubMed PubMed Central Google Scholar

Mouchahoir, T. & Schiel, JE Entwicklung eines LC-MS/MS-Peptidkartierungsprotokolls für den NISTmAb. Anal. Bioanal. Chem. 410, 2111–2126. https://doi.org/10.1007/s00216-018-0848-6 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Sanyal, G., Särnefält, A. & Kumar, A. Überlegungen zur bioanalytischen Charakterisierung und Chargenfreigabe von COVID-19-Impfstoffen. NPJ Vaccines 6, 53. https://doi.org/10.1038/s41541-021-00317-4 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Ambrogelly, A. et al. Analytische Vergleichbarkeitsstudie rekombinanter monoklonaler Antikörpertherapeutika. MAbs 10, 513–538. https://doi.org/10.1080/19420862.2018.1438797 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Koscielniak, D., Wons, E., Wilkowska, K. & Sektas, M. Nicht programmierte Transkriptionsrahmenverschiebung ist häufig und stark vom RNA-Polymerasetyp abhängig. Mikrob. Zellfakt. 17, 184. https://doi.org/10.1186/s12934-018-1034-4 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Walsh, D. Pockenviren: Rutschen und Gleiten durch Transkription und Übersetzung. PLoS Pathog. 13, e1006634. https://doi.org/10.1371/journal.ppat.1006634 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Schürch, S. Charakterisierung von Nukleinsäuren durch Tandem-Massenspektrometrie – das zweite Jahrzehnt (2004–2013): Von DNA zu RNA und modifizierten Sequenzen. Massenspektrometer. Rev. 35, 483–523. https://doi.org/10.1002/mas.21442 (2016).

Artikel ADS CAS PubMed Google Scholar

Zhang, N. et al. Eine allgemeine LC-MS-basierte RNA-Sequenzierungsmethode zur direkten Analyse von Mehrfachbasenmodifikationen in RNA-Mischungen. Nukleinsäuren Res. 47, e125–e125. https://doi.org/10.1093/nar/gkz731 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

McLuckey, SA, Van Berkel, GJ & Glish, GL Tandem-Massenspektrometrie kleiner, mehrfach geladener Oligonukleotide. Marmelade. Soc. Massenspektrometer. 3, 60–70. https://doi.org/10.1021/jasms.8b00217 (1992).

Artikel CAS PubMed Google Scholar

D'Ascenzo, L. et al. Pytheas: Ein Softwarepaket zur automatisierten Analyse von RNA-Sequenzen und -Modifikationen mittels Tandem-Massenspektrometrie. Nat. Komm. 13, 2424. https://doi.org/10.1038/s41467-022-30057-5 (2022).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Perkins, DN, Pappin, DJ, Creasy, DM & Cottrell, JS Wahrscheinlichkeitsbasierte Proteinidentifizierung durch Suche in Sequenzdatenbanken mithilfe von Massenspektrometriedaten. Elektrophorese 20, 3551–3567. https://doi.org/10.1002/(sici)1522-2683(19991201)20:18%3c3551::Aid-elps3551%3e3.0.Co;2-2 (1999).

3.0.Co;2-2" data-track-action="article reference" href="https://doi.org/10.1002%2F%28sici%291522-2683%2819991201%2920%3A18%3C3551%3A%3AAid-elps3551%3E3.0.Co%3B2-2" aria-label="Article reference 33" data-doi="10.1002/(sici)1522-2683(19991201)20:183.0.Co;2-2">Artikel CAS PubMed Google Scholar

Packer, M., Gyawali, D., Yerabolu, R., Schariter, J. & White, P. Ein neuartiger Mechanismus für den Verlust der mRNA-Aktivität in Lipid-Nanopartikel-Abgabesystemen. Nat. Komm. 12, 6777. https://doi.org/10.1038/s41467-021-26926-0 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Wolf, EJ et al. Humane RNase 4 verbessert die mRNA-Sequenzcharakterisierung durch LC-MS/MS. Nukleinsäuren Res. 50, e106–e106. https://doi.org/10.1093/nar/gkac632 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

Die Autoren danken unseren Partnern bei BioNTech, Andreas Kuhn und Julia Schlereth, für ihre Unterstützung und Kommunikation. Wir danken unserer langjährigen Partnerin bei Thermo, Jennifer Sutton, dass sie uns die Zusammenarbeit bei der Entwicklung des Oligonukleotid-Analysemoduls von BioPharma Finder ermöglicht hat. Wir danken Taylor Dufield für Beiträge zur Methodenoptimierung. Wir danken Erika Jensen und Mojgan Kouhnavard für ihre Arbeit zur Messung des N1-Methylpseudouridin-Extinktionskoeffizienten. Abschließend danken wir den Pfizer-Führungskräften Jeff Ryczek, Lisa Marzilli, Justin Sperry und Margaret Ruesch für ihre Unterstützung und Beratung bei der Entwicklung und Anwendung dieser Methode.

Diese Autoren haben gleichermaßen beigetragen: Brian C. Gau und Andrew W. Dawdy.

BioTherapeutics Pharmaceutical Sciences, Pfizer Inc, Chesterfield, MO, USA

Brian C. Gau, Andrew W. Dawdy, Hanliu Leah Wang, Bradley Bare, Carlos H. Castaneda, Olga V. Friese und Thomas F. Lerch

BioTherapeutics Pharmaceutical Sciences, Pfizer Inc, Andover, MA, USA

Matthew S. Thompson, David J. Cirelli und Jason C. Rouse

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

AD und BG haben gleichermaßen zu dieser Arbeit beigetragen, und die Korrespondenz kann auch an einen oder beide Autoren gerichtet werden. Die Autoren möchten mitteilen, dass ihrer Meinung nach die ersten beiden Autoren als gemeinsame Erstautoren anzusehen sind. Alle Autoren haben das Manuskript überprüft.

Korrespondenz mit Brian C. Gau oder Andrew W. Dawdy.

Alle Autoren sind Mitarbeiter von Pfizer.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Gau, BC, Dawdy, AW, Wang, HL et al. Oligonukleotidkartierung mittels Massenspektrometrie, um eine umfassende Primärstrukturcharakterisierung eines mRNA-Impfstoffs gegen SARS-CoV-2 zu ermöglichen. Sci Rep 13, 9038 (2023). https://doi.org/10.1038/s41598-023-36193-2

Zitat herunterladen

Eingegangen: 17. März 2023

Angenommen: 30. Mai 2023

Veröffentlicht: 03. Juni 2023

DOI: https://doi.org/10.1038/s41598-023-36193-2

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.