banner

Nachricht

Nov 04, 2023

Deep Visual Proteomics definiert Single

Nature Biotechnology Band 40, Seiten 1231–1240 (2022)Diesen Artikel zitieren

56.000 Zugriffe

57 Zitate

539 Altmetrisch

Details zu den Metriken

Trotz der Verfügbarkeit bildgebender und massenspektrometrischer Methoden für die räumliche Proteomik bleibt die Verbindung von Bildern mit Messungen der Proteinhäufigkeit in Einzelzellauflösung eine große Herausforderung. Hier stellen wir Deep Visual Proteomics (DVP) vor, das eine durch künstliche Intelligenz gesteuerte Bildanalyse zellulärer Phänotypen mit automatisierter Einzelzell- oder Einzelkern-Lasermikrodissektion und ultrahochempfindlicher Massenspektrometrie kombiniert. DVP verknüpft die Proteinhäufigkeit mit komplexen zellulären oder subzellulären Phänotypen und bewahrt gleichzeitig den räumlichen Kontext. Durch das individuelle Herausschneiden von Kernen aus der Zellkultur haben wir verschiedene Zellzustände mit proteomischen Profilen klassifiziert, die durch bekannte und nicht charakterisierte Proteine ​​definiert sind. In einem archivierten primären Melanomgewebe identifizierte DVP räumlich aufgelöste Proteomveränderungen, wenn normale Melanozyten in ein vollständig invasives Melanom übergehen. Dabei wurden Signalwege aufgedeckt, die sich mit dem Fortschreiten des Krebses räumlich verändern, wie z Antigenpräsentation. Die Fähigkeit von DVP, präzise räumliche proteomische Informationen im Gewebekontext zu speichern, hat Auswirkungen auf die molekulare Profilierung klinischer Proben.

Die Vielseitigkeit, Auflösung und Multimodalität der modernen Mikroskopie liefert immer detailliertere Bilder der Heterogenität einzelner Zellen und der Gewebeorganisation1. Derzeit wird meist auf eine vordefinierte Untergruppe von Proteinen abgezielt, die jedoch weit unter der tatsächlichen Komplexität des Proteoms liegt. Wir nutzten die wesentlich höhere Empfindlichkeit der auf Massenspektrometrie (MS) basierenden Technologie und wollten die Analyse von Proteomen in ihrem natürlichen, subzellulären Kontext ermöglichen, um ihren Beitrag zu Gesundheit und Krankheit zu untersuchen. Wir kombinierten Bildgebung mit Submikrometerauflösung, Bildanalyse zur Einzelzell-Phänotypisierung auf Basis künstlicher Intelligenz (KI) und Isolierung mit einem hochempfindlichen Proteomik-Workflow2 (Abb. 1). Als zentrale Herausforderungen erwiesen sich die genaue Definition einzelner Zellgrenzen und Zellklassen sowie die Übertragung der automatisch definierten Merkmale in proteomische Proben, die zur Analyse bereit sind. Zu diesem Zweck stellen wir die Software „BIAS“ (Biology Image Analysis Software) vor, die Raster- und Laser-Mikrodissektionsmikroskope (LMD) koordiniert. Dies kombiniert nahtlos die datenreiche Bildgebung von Zellkulturen oder archivierten Biobankgeweben (formalinfixiert und in Paraffin eingebettet (FFPE)) mit Deep-Learning-basierter Zellsegmentierung und maschinellem Lernen-basierter Identifizierung von Zelltypen und -zuständen. Zelluläre oder subzelluläre Objekte von Interesse werden von der KI allein oder nach Anweisung ausgewählt, bevor sie einem automatisierten LMD und proteomischen Profiling unterzogen werden. Durch DVP generierte Daten können ausgewertet werden, um Proteinsignaturen zu entdecken, die molekulare Einblicke in die Proteomvariation auf phänotypischer Ebene liefern und gleichzeitig vollständige räumliche Informationen beibehalten.

DVP kombiniert hochauflösende Bildgebung, KI-gesteuerte Bildanalyse zur Einzelzellklassifizierung und -isolierung mit einem hochempfindlichen Proteomik-Workflow2. DVP verknüpft die datenreiche Bildgebung von Zellkulturen oder archivierten Biobankgeweben von Patienten mit Deep-Learning-basierter Zellsegmentierung und maschinellem Lernen-basierter Identifizierung von Zelltypen und -zuständen. (Un)überwachte KI-klassifizierte zelluläre oder subzelluläre Objekte von Interesse werden einer automatisierten LMD- und MS-basierten proteomischen Profilierung unterzogen. Die anschließende bioinformatische Datenanalyse ermöglicht Data Mining zur Entdeckung von Proteinsignaturen und liefert molekulare Einblicke in die Proteomvariation bei Gesundheits- und Krankheitszuständen auf der Ebene einzelner Zellen. tSNE, t-verteilte stochastische Nachbareinbettung.

Die mikroskopiebezogenen Aspekte des DVP-Workflows basieren auf hochauflösender Bildgebung ganzer Objektträger, maschinellem Lernen (ML) und Deep Learning (DL) für die Bildanalyse.

Zunächst verwendeten wir Rastermikroskopie, um hochauflösende Bilder ganzer Objektträger zu erhalten, und entwickelten eine Software-Suite für die integrative Bildanalyse mit der Bezeichnung „BIAS“ (Methoden). BIAS verarbeitet mehrere zweidimensionale (2D) und dreidimensionale (3D) Mikroskopie-Bilddateiformate und unterstützt wichtige Mikroskopanbieter und Datenformate. Es kombiniert Bildvorverarbeitung, DL-basierte Bildsegmentierung, Merkmalsextraktion und ML-basierte Phänotypklassifizierung. Aufbauend auf einem aktuellen DL-basierten Algorithmus für die Zytoplasma- und Kernsegmentierung3 haben wir mehrere Optimierungen vorgenommen, um Vorverarbeitungsalgorithmen zu implementieren, um qualitativ hochwertige Bilder über große Bilddatensätze hinweg aufrechtzuerhalten. DL-Methoden erfordern große Trainingsdatensätze, was aufgrund der begrenzten Größe hochwertiger Trainingsdaten eine erhebliche Herausforderung darstellt4. Um dieser Herausforderung zu begegnen, haben wir nucleAIzer3 verwendet und eine projektspezifische Bildstilübertragung angewendet, um künstliche Mikroskopbilder zu synthetisieren, die realen Bildern ähneln. Dieser Ansatz ist von Natur aus an verschiedene biologische Szenarien anpassbar, beispielsweise an neue Zell- und Gewebetypen oder Färbetechniken5. Mit diesen synthetischen Bildern haben wir ein tiefes neuronales Netzwerk trainiert, um das interessierende Zellkompartiment (z. B. Zellkern oder Zytoplasma) gezielt zu segmentieren (Abb. 2a). Wir verglichen es mit zwei führenden DL-Ansätzen – unet4nuclei6 und Cellpose7 – und einer weit verbreiteten adaptiven schwellenwertbasierten und objektaufteilenden Methode8. Unsere Zell- und Kernsegmentierungsalgorithmen von Zellkulturen und Geweben zeigten die höchste Genauigkeit (Abb. 2b, erweiterte Daten Abb. 1a, Tabelle 1 und Ergänzungstabelle 1). Unsere aktuellen Benchmarking-Ergebnisse werden durch eine frühere Studie3 gestützt, in der wir einen umfassenden Vergleich mit zusätzlichen Methoden und Software durchgeführt haben (z. B. ilastik9, an einem großen heterogenen Mikroskopie-Bildsatz). Für die interaktive Entdeckung zellulärer Phänotypen führt BIAS eine Extraktion phänotypischer Merkmale durch und berücksichtigt dabei Morphologie und Nachbarschaftsmerkmale auf der Grundlage überwachter und unbeaufsichtigter ML (Erweiterte Daten, Abb. 1b und Methoden). Die merkmalsbasierte phänotypische Klassifizierung lässt sich zur präzisen Zellklassifizierung problemlos mit dem Biomarker-Expressionsniveau aus der Antikörperfärbung kombinieren. ML wurde zuvor für die Bildanalyse und Zellauswahl verwendet, jedoch nicht mit unvoreingenommener Proteomik kombiniert10. Darüber hinaus haben wir BIAS um eine Python-Schnittstelle erweitert; Somit ist der Datenzugriff und die Manipulation auch mit Standard-Python-Funktionen auf generische Weise möglich, einschließlich der Integration von Open-Source-Paketen und benutzerdefinierten Algorithmen.

a, KI-gesteuerte Kern- und Zytoplasma-Segmentierung von normal erscheinenden und Krebszellen und -geweben mithilfe von BIAS. b: Wir haben die Genauigkeit seines Segmentierungsansatzes mithilfe der F1-Metrik verglichen und die Ergebnisse mit drei zusätzlichen Methoden verglichen – M1 ist unet4nuclei6, M2 ist CellProfiler8 und M3 ist Cellpose7 – während sich OUR auf nucleAIzer3 bezieht. Die Balken zeigen die mittleren F1-Ergebnisse mit SEM; n = 10 unabhängige Bilder für Melanomgewebe und (U2OS-)Zellen und n = 20 für Speicheldrüsengewebe. Visuelle Darstellung der Segmentierungsergebnisse: Grüne Bereiche entsprechen richtig positiv, blau entspricht falsch positiv und rot entspricht falsch negativ. c, BIAS dient als Schnittstelle zwischen dem Raster- und einem LMD-Mikroskop und ermöglicht eine hochpräzise Übertragung von Zellkonturen zwischen den Mikroskopen. Darstellung des Schnittversatzes zum interessierenden Objekt und der optimalen Wegfindung. d, Praktische Darstellung der Funktionen im oberen Bereich. e, Immunfluoreszenzfärbung des menschlichen Eileiterepithels mit FOXJ1- und EpCAM-Antikörpern zum Nachweis von Flimmer- bzw. Epithelzellen. Linkes Feld: Flimmerzellen (FOXJ1-positiv) und sekretorische (FOXJ1-negative) Zellen. Rechtes Feld: Zellklassifizierung basierend auf der FOXJ1-Intensität. Klasse 1 (FOXJ1-positiv) und Klasse 2 (FOXJ1-negativ); Vergrößerungsfaktor = ×387. f, PCA von FOXJ1-positiven und FOXJ1-negativen Zellproteomen. g, Wärmekarte bekannter Proteinmarker für sekretorische und Flimmerzellen. Der Proteingehalt wird mit einem Z-Score bewertet. Sternchen stehen für unterstellte Daten. Die Markerliste wurde aus dem Human Protein Atlas20-Projekt abgeleitet und basiert auf der Literatursuche. h, Vulkandiagramm des paarweisen proteomischen Vergleichs zwischen FOXJ1-positiven und FOXJ1-negativen Zellen. Zelltypspezifische Markerproteine ​​sind in Grün und Türkis hervorgehoben, und Schwarz stellt potenzielle neuartige Markerproteine ​​dar. Signifikante angereicherte zelltypspezifische Proteine ​​werden über den schwarzen Linien angezeigt (zweiseitiger t-Test, FDR < 0,05, s0 = 0,1, n = 4 biologische Replikate).

Um die mit BIAS entdeckten zellulären Merkmale physikalisch zu extrahieren, haben wir eine Schnittstelle zwischen Raster- und LMD-Mikroskopen (derzeit Zeiss PALM MicroBeam und Leica LMD6 und LMD7) entwickelt (Abb. 2c). BIAS überträgt Zellkonturen zwischen den Mikroskopen und behält dabei die volle Genauigkeit bei. LMD hat mit einem x150-Objektiv eine theoretische Genauigkeit von 70 nm, in der Praxis erreichten wir jedoch 200 nm. Nach der Optimierung kann der LMD7 autonom 1.250 hochauflösende Konturen pro Stunde ausschneiden, was 50 bis 100 Zellen pro Probe entspricht (Methoden). Um mögliche laserinduzierte Schäden an Zellmembranen zu verhindern, schneiden wir Konturen mit einem Versatz heraus (Abb. 2c, d und Zusatzvideos 1 und 2).

Aktuelle LMD-Methoden bewahren den räumlichen Kontext, sind jedoch meist auf mit dem menschlichen Auge beobachtbare Phänotypen beschränkt und erfordern eine manuelle Auswahl von Zellen, was häufig zu einer Vermischung verschiedener Zelltypen führt, was den Durchsatz und die De-novo-Entdeckung einschränkt11.

Um die Empfindlichkeit, Spezifität und Robustheit unseres DVP-Workflows zu untersuchen, haben wir normales menschliches Eileitergewebe gewonnen und Flimmerzellen von sekretorischen Zellen – den beiden Hauptzelltypen des Eileiterepithels12 – mithilfe des zelllinienspezifischen Transkriptionsfaktors FOXJ1, a getrennt Hauptregulator der Zilienfunktion und Messung ihrer Proteome (Abb. 2e – h, erweiterte Daten Abb. 1c – f und Ergänzungstabelle 2). Wir haben ausschließlich FOXJ1 (Zilienzellen) in FOXJ1-gefärbten Zellen nachgewiesen (Abb. 2e, g), zusammen mit mehr als 5.000 anderen quantifizierten Proteinen mit hervorragenden Korrelationen biologischer Replikate (Extended Data Abb. 1d, e). Die bioinformatische Analyse der Unterschiede in der Proteinhäufigkeit spiegelte die biologischen Merkmale der verschiedenen Zelltypen wider. (Abb. 2f – h und erweiterte Daten Abb. 1c – f). Dies wurde durch bekannte Proteinmarker von Flimmerzellen vorangetrieben und auf Proteine ​​ausgeweitet, die noch nicht funktionell mit diesen Zelltypen assoziiert sind. Wir haben das Eileiterepithel als Beispiel verwendet, um die Bedeutung der Kombination aus antikörperbasierter Gewebefärbung und unvoreingenommener, quantitativer Proteomik hervorzuheben. Solche In-vivo-Zelltypvergleiche werden die Entdeckung von Zelltyp- und Zellzustandsmarkern ermöglichen und unvoreingenommene Informationen liefern, um Krankheitszustände auf globaler Proteomebene zu verstehen. Bemerkenswert ist, dass hochgradiger seröser Eierstockkrebs seinen Ursprung im Epithel des Eileiters hat und unsere Methode nun angewendet werden kann, um den frühen Ausbruch der Krankheit zu untersuchen, ohne nicht verwandte Zelltypen zu vermischen13.

Wir haben unseren Arbeitsablauf auf eine ungestörte Krebszelllinie angewendet, um zu bestimmen, ob DVP die funktionelle Heterogenität zwischen scheinbar ähnlichen Zellen charakterisieren kann (fluoreszierender Ubiquitinierungs-basierter Zellzyklusindikator (FUCCI) U2OS-Zellen14). Nach der DL-basierten Segmentierung zur Kern- und Zellmembrandetektion isolierten wir 80–100 Einzelzellen oder 250–300 Kerne pro Phänotyp (Abb. 2c, d und 3a, b). Die Analyse einer kleinen Anzahl von Zellen durch MS ist seit langem ein Ziel, das durch gewaltige analytische Herausforderungen bei der Übertragung, Verarbeitung und Analyse winziger Proben15, die wir wiederum angegangen sind, gebremst wird. Wir haben Proben mithilfe unseres kürzlich entwickelten Arbeitsablaufs für eine extrem geringe Probeneingabe2,16 verarbeitet, der jegliche Probentransferschritte überflüssig macht und eine Entvernetzung in sehr geringen Volumina gewährleistet (Methoden). Wir fanden heraus, dass Proben aus 384 Bohrlöchern ohne zusätzlichen Probentransfer oder Aufreinigung direkt analysiert werden konnten. Für MS-Messungen verwendeten wir eine datenunabhängige Erfassungsmethode mit paralleler Akkumulation und serieller Fragmentierung mit einer zusätzlichen Ionenmobilitätsdimension und optimaler Fragment-Ionenrückgewinnung (diaPASEF) auf einem neu entwickelten Massenspektrometer2,17. Replikate von Zell- und Kernproteomen zeigten eine hohe quantitative Reproduzierbarkeit (Pearson r = 0,96), und die Proteome ganzer Zellen unterschieden sich von denen der Kerne allein, wie aus subzellulären Proteomikexperimenten auf der Grundlage biochemischer Trennung zu erwarten war (Extended Data Abb. 2a, b). In der bioinformatischen Anreicherungsanalyse waren Begriffe wie Plasmamembran, Mitochondrium, Nukleosomen und Transkriptionsfaktorkomplexe von hoher Bedeutung (False Discovery Rate (FDR) < 10–5) (Abb. 3c).

a, Segmentierung ganzer Zellen und Kerne im BIAS von DNA (DAPI)-gefärbten U2OS-Zellen. Maßstabsbalken, 20 μm b, automatisches LMD ganzer Zellen und Kerne in 384-Well-Platten. Bilder zeigen Brunnen nach der Entnahme. c, Relative Proteinspiegel (x-Achse) der wichtigsten Zellkompartimente zwischen ganzzellspezifischen (n = 3 biologischen Replikaten) und kernspezifischen (n = 3 biologische Replikate) Proteomen. Die Y-Achse zeigt die Punktdichte an. d, links: konzeptionelle Arbeitsabläufe des Phänotyp-Finder-Modells von BIAS für die ML-basierte Klassifizierung zellulärer Phänotypen. Rechts: Ergebnisse der unbeaufsichtigten ML-basierten Klassifizierung von sechs verschiedenen U2OS-Kernklassen basierend auf morphologischen Merkmalen und DNA-Färbungsintensität. Farben repräsentieren Klassen. Maßstabsbalken, 20 μm. e, phänotypische Merkmale, die von ML verwendet werden, um sechs verschiedene Kernklassen zu definieren. Radardiagramme zeigen Z-bewertete relative Niveaus morphologischer Merkmale (Kernfläche, Umfang, Festigkeit und Formfaktor) und DNA-Färbungsintensität (Gesamt-DAPI-Signal). f, Beispielbilder von Kernen aus den sechs durch ML identifizierten Klassen. Die blaue Farbe zeigt die Intensität der DNA-Färbung und die rote Farbe die Intensität der EdU-Färbung, um Zellen zu identifizieren, die sich in der Replikation befinden. Die dargestellten Kerne sind zur Visualisierung vergrößert und spiegeln nicht die tatsächliche Größe wider. g, PCA von fünf Interphasenklassen basierend auf 3.653 Proteingruppen nach Datenfilterung. Replikate von Klassen (n = 3 biologische Replikate) werden durch Ellipsen mit einem Konfidenzintervall von 95 % hervorgehoben. h, Anreicherungsanalyse von Proteinen, die in den fünf Kernklassen reguliert sind. Signifikante Proteine ​​(515 ANOVA signifikant, FDR < 0,05, s0 = 0,1) wurden mit dem Satz unveränderter Proteine ​​verglichen, basierend auf dem Gene Ontology Biological Process (GOBP), Reactome Pathways sowie Zellzyklus- und Krebsanmerkungen, die aus dem Human Protein Atlas abgeleitet wurden ( HPA)20. Es wurde ein exakter Fisher-Test mit einem Benjamini-Hochberg-FDR von 0,05 verwendet (Ergänzungstabelle 3). i, Unbeaufsichtigte hierarchische Clusterbildung aller 515 ANOVA-signifikanten Proteingruppen (Ergänzungstabelle 4). Von der HPA gemeldete zellzyklusregulierte Proteine ​​werden in der unteren Leiste angezeigt. Kernklassen (n = 3 biologische Replikate) werden in der Zeilenleiste angezeigt. C1–C4 zeigen Cluster, die in den verschiedenen Kernklassen hochreguliert sind. j, Netzwerkanalyse angereicherter Pfade für Proteincluster C1–C4. Die Pathway-Anreicherungsanalyse wurde mit dem ClusterProfiler R-Paket36 durchgeführt. ER, endoplasmatisches Retikulum; PC, Hauptkomponente.

Um herauszufinden, ob sich morphologische Unterschiede zwischen Kernen auch in ihren Proteomen widerspiegeln, haben wir ein unbeaufsichtigtes Phänotyp-Findermodell verwendet, um Gruppen morphologisch unterschiedlicher Kerne basierend auf Kernfläche, Umfang, Formfaktor, Festigkeit und DNA-Färbungsintensität zu identifizieren (Abb. 3d). ML fand drei primäre Kernklassen (jeweils 27–37 %) und identifizierte außerdem drei seltene (jeweils 2–4 %) (Extended Data Abb. 2c). Die resultierenden sechs unterschiedlichen Kernklassen wiesen sichtbare Unterschiede in Größe und Form auf, wobei Klasse 1 mitotische Zustände und die verbleibenden fünf Klassen die Interphase mit unterschiedlicher Merkmalsgewichtung darstellten (Abb. 3e, f). Wir haben uns für die nachfolgende Analyse auf diese fünf Kernklassen unbekannter Herkunft konzentriert. Bei der Hauptkomponentenanalyse (PCA) gruppierten sich Replikate der jeweiligen Proteome eng und die häufigeren Klassen (2, 3 und 5) gruppierten sich (Abb. 3g). Um diese Beobachtung zu verifizieren und zu quantifizieren, verglichen wir das Proteom jeder Zellklasse mit einem Proteom aller „gemischten“ Kerne in einem Sichtfeld. Dies ergab, dass die seltensten Zellklassen im Vergleich zu nicht klassifizierten „Massen“-Proteomen die höchste Anzahl unterschiedlich exprimierter Proteine ​​aufwiesen (Extended Data Abb. 2d, e). Als nächstes fragten wir, ob die proteomischen Unterschiede zwischen den fünf Kernklassen auf funktionelle Unterschiede zwischen den Interphasenzuständen schließen lassen (Abb. 3d, f). Die 515 deutlich unterschiedlich exprimierten Proteine ​​über die Klassen hinweg wurden mit Kern- und Zellzyklus-bezogenen Proteinen angereichert (z. B. „Wechsel der Ursprünge in einen postreplikativen Zustand“ und „Kondensation von Prophase-Chromosomen“), was darauf hindeutet, dass der Zellzyklus ein funktioneller Faktor ist Treiber der Trennung (Abb. 3h – j, erweiterte Daten Abb. 2f und Ergänzungstabellen 3 und 4). Beim Vergleich unserer Daten mit einem Einzelzellbildgebungsdatensatz zellzyklusregulierter Proteine19 fanden wir eine signifikante Anreicherung unserer regulierten Proteine ​​(FDR < 10−6). Die Kernfläche, eines der treibenden Merkmale unter den verschiedenen identifizierten Klassen, nahm während der Interphase von G1- zu S/G2-Zellen zu (Abb. 3e und erweiterte Daten Abb. 3a – c), was die Bedeutung des Zellzyklus für die Definition der Kerne weiter untermauert Klassen.

Unsere Einzelzell-Proteome entdeckten mehrere uncharakterisierte Proteine ​​und boten die Möglichkeit, sie mit einer potenziellen Zellfunktion in Verbindung zu bringen. Die Konzentration auf C11orf98, C7orf50, C1orf112 und C19orf53, die nach der Datenfilterung übrig blieben (ANOVA P <0,05), zeigte klassenspezifische Expressionsmuster (Extended Data Abb. 3d). C7orf50 wurde am stärksten in den Nukleolen der Kerne der Klassen 2, 4 und 3 exprimiert, die S/G2-spezifische Eigenschaften aufwiesen (Abb. 3f und erweiterte Daten Abb. 3d, e), was darauf hindeutet, dass seine Expression durch den Zellzyklus reguliert wird. Tatsächlich haben wir höhere C7orf50-Spiegel in G1/S und S/G2 im Vergleich zu G1-Phasenzellen bestätigt (Extended Data Abb. 3e). Da zellzyklusregulierte Proteine ​​möglicherweise mit der Krebsprognose assoziiert sind19, untersuchten wir C7orf50 im humanpathologischen Atlas20, wo eine hohe Expression mit günstigen Ergebnissen bei Bauchspeicheldrüsenkrebs verbunden war (Extended Data Abb. 3g; P <0,001). Die bioinformatische Analyse ergab eine Interaktion, Co-Expression und Co-Lokalisierung mit dem Protein LYAR („Zellwachstum regulierendes Nukleolarprotein“), was auf einen funktionellen Zusammenhang mit der Zellproliferation schließen lässt (Extended Data Abb. 3f,h).

Klasse 6 zeigte eine faszinierende proteomische Signatur unabhängig von bekannten Zellzyklusmarkern (Abb. 3i, j). Diese seltenen, bohnenförmigen Kerne zeigten eine Hochregulierung spezifischer Zytoskelett- und Zelladhäsionsproteine ​​(z. B. VIM, TUBB, ACTB und ITGB1), was darauf hindeutet, dass diese Signaturen von migrierenden Zellen herrühren, die eine Kerndeformation durchmachen, was auf eine Zellinvasion schließen lässt21,22. Beachten Sie, dass wir Kerne anhand von 2D-Bildern klassifiziert haben, LMD sie jedoch in 3D isoliert. Somit untersuchen Proben auch die morphologiebedingte Neulokalisierung von Proteinen um den Zellkern herum, wie am Beispiel von Klasse-6-Kernen. Ebenso erfasst das Herausschneiden der Kerne bis zu einem gewissen Grad den Transport von Proteinen zum und vom Zytosol.

Diese Zellkulturexperimente belegen, dass DVP zelluläre Phänotypen, Heterogenität und Dynamik für häufige und seltene Phänotypen auf unvoreingenommene Weise mit der Proteomebene korreliert.

Im Zuge diagnostischer Untersuchungen werden routinemäßig Milliarden von Patientenproben gesammelt und in den Archiven pathologischer Abteilungen auf der ganzen Welt gespeichert23. Die präzise proteomische Charakterisierung einzelner Zellen in ihrem räumlichen und subzellulären Kontext anhand von Gewebeschnitten könnte enorme klinische Auswirkungen haben und das aufstrebende Gebiet der digitalen Pathologie ergänzen24. Wir haben archiviertes, in Paraffin eingebettetes Gewebe eines Speicheldrüsen-Azinuszellkarzinoms ausgewählt, einer seltenen und wenig untersuchten bösartigen Erkrankung der epithelialen Sekretionszellen der Speicheldrüse. Wir haben ein immunhistochemisches (IHC) Färbeprotokoll auf Glasmembranobjektträgern für LMD entwickelt und das Gewebe für EpCAM gefärbt, um die Zellgrenzen für die Segmentierung und Merkmalsextraktion durch BIAS zu skizzieren (Methoden). Diese histologisch normal erscheinenden Regionen bestanden hauptsächlich aus Azinus-, Duktal- und Myoepithelzellen, während die Karzinomkomponente überwiegend einheitliche Tumorzellen mit runden Kernen und reichlich basophilem Zytoplasma aufwies (Abb. 4a, b).

a, IHC-Färbung eines Azinuszellkarzinoms der Speicheldrüse mit dem Zelladhäsionsprotein EpCAM. b, Repräsentative Regionen aus normal erscheinendem Gewebe (obere Felder I und II) und Azinuszellkarzinom (untere Felder III und IV) aus a. c, DVP-Workflow angewendet auf das Azinuszellkarzinomgewebe. DL-basierter Einzelzellnachweis von normal erscheinenden (grün) und neoplastischen (magentafarbenen) Zellen, die positiv für EpCAM sind. Zellklassifizierung basierend auf phänotypischen Merkmalen (Formfaktor, Fläche, Festigkeit, Umfang und EpCAM-Intensität). d, Proteomkorrelationen von Replikaten aus normal erscheinenden (normal, n = 6) oder Krebsregionen (Krebs, n = 9). e, Vulkandiagramm des paarweisen proteomischen Vergleichs zwischen normalem und Krebsgewebe. Im T-Test signifikante Proteine ​​(zweiseitiger T-Test, FDR < 0,05, s0 = 0,1, n = 6 biologische Replikate für normal und n = 9 für Krebs) werden durch schwarze Linien hervorgehoben. Proteine, die in normalem Gewebe stärker exprimiert werden, sind auf der linken Seite des Vulkans grün hervorgehoben, einschließlich bekannter Azinzellmarker (AMY1A, CA6 und PIP). Proteine, die im Azinuszellkarzinom stärker exprimiert werden, sind rechts in Magenta dargestellt, einschließlich der Protoonkogen-SRC- und Interferon-Reaktionsproteine ​​(MX1 und HLA-A; Ergänzungstabelle 6). f, IHC-Validierung proteomischer Ergebnisse. CNN1, SRC, CK5 und FASN sind in normalem Gewebe oder Krebsgewebe deutlich angereichert. Maßstabsbalken, 100 μm.

Um krankheitsspezifische Proteinsignaturen zu identifizieren, wollten wir die histologisch normal erscheinenden Azinuszellen mit den bösartigen Zellen vergleichen, anstatt sie mit unterschiedlichen Anteilen nicht verwandter Zellen zu vermischen. Zu diesem Zweck klassifizierten wir Azinus- und Gangzellen aus normalem Ohrspeicheldrüsengewebe anhand ihrer zelltypspezifischen morphologischen Merkmale und isolierten Einzelzellklassen für die Proteomanalyse (Abb. 4c und erweiterte Daten Abb. 4a). Die bioinformatische Analyse der gemessenen Proteomunterschiede ergab signifikante biologische Unterschiede zwischen diesen benachbarten Zelltypen, die ihre unterschiedlichen physiologischen Funktionen widerspiegeln. Azinuszellen, die Speichel in sekretorischen Granula produzieren und absondern, zeigten eine hohe Expression von Proteinen, die mit dem Vesikeltransport und der Glykosylierung zusammenhängen, zusammen mit bekannten Azinuszellmarkern wie α-Amylase (AMY1A), CA6 und PIP (Extended Data Abb. 4b). Im Gegensatz dazu exprimierten Duktalzellen große Mengen an Mitochondrien und stoffwechselbezogenen Proteinen, die erforderlich sind, um den hohen Energiebedarf für die Speichelsekretion zu decken25 (Erweiterte Daten, Abb. 4c und Ergänzungstabelle 5). Zum Vergleich haben wir ausschließlich bösartige und gutartige Azinuszellen aus den verschiedenen Regionen innerhalb desselben Gewebeabschnitts herausgeschnitten. Die Proteome von Azinuszellen gruppierten sich unabhängig vom Krankheitszustand, was auf eine starke Signatur der Ursprungszelle hinweist (Erweiterte Daten, Abb. 4d). Die Analyse von sechs normal erscheinenden Replikaten und neun neoplastischen Regionen zeigte eine hervorragende Proteomkorrelation innerhalb der Gruppe (Pearson r > 0,96). Die geringere Korrelation zwischen normalen Zellen und Krebszellen spiegelte krankheitsspezifische und zelltypspezifische Proteomveränderungen wider (Pearson r = 0,8; Abb. 4d, e und Ergänzungstabelle 6). Azinuszellmarker im Karzinom waren im Einklang mit früheren Berichten deutlich herunterreguliert25. Durch DVP konnten wir die Hochregulierung von Interferon-Reaktionsproteinen (z. B. MX1 und HLA-A; Ergänzungstabelle 6) und des Protoonkogens SRC entdecken, beides umsetzbare therapeutische Ziele 26 (Abb. 4e). Wir validierten die proteomischen Ergebnisse mithilfe der IHC-Analyse signifikant angereicherter Proteine ​​in normal erscheinendem oder krebsartigem Gewebe. Dies führte zur Auswahl von CNN1, SRC, CK5 und FASN (Abb. 4f), was unsere proteomischen Ergebnisse bestätigte, das Fehlen einer Kontamination zeigte und die Spezifität unseres DVP-Ansatzes unterstützte.

Die Entschlüsselung der molekularen Veränderungen bei der Entwicklung und dem Fortschreiten des Melanoms ist der Schlüssel zur Identifizierung therapeutischer Schwachstellen bei dieser stark metastasierenden Erkrankung. Da pathogene Mutationen bei Melanomen weitgehend katalogisiert sind27,28,29, machten wir uns daran, räumlich aufgelöste Proteome verschiedener zellulärer Phänotypen der Melanomprogression direkt zu untersuchen (Abb. 5a, b und erweiterte Daten Abb. 5a, b). Wir haben 17 Jahre lang konserviertes FFPE-eingebettetes Primärtumormaterial mit zwei Markern, SOX10 und CD146, gemeinsam gefärbt, um Melanomzellen abzubilden. Da eine Überexpression von CD146 mit dem Fortschreiten des Melanoms in Zusammenhang steht und eine Immuntherapie gegen CD146 auf die Metastasierung abzielt30, verwendeten wir CD146 als Marker für das Fortschreiten der Krankheit in unserer Analyse. ML sagte fünf Klassen mit klar definierter räumlicher Verteilung voraus: Klasse 1, Melanoma in situ; Klasse 2, überwiegend Tumor; Klasse 3, Zellen der Tumormikroumgebung; Klasse 4, angereichert mit Regionen mit hohem CD146-Gehalt; und Klasse 5, angereichert in CD146-armen Regionen. Wir verwendeten High-Content-Imaging, um die erforderliche Anzahl von Zellen zu bestimmen, um statistisch und analytisch robuste zelluläre Phänotypen für eine präzise Zelltyp- und Zustandsisolierung innerhalb einer räumlichen Region zu identifizieren. Aus diesem Grund haben wir typischerweise etwa 100 Zellen pro Probe gesammelt (Methoden). Einschließlich der Replikate isolierten und profilierten wir 27 verschiedene Proben aus sieben einzigartigen Regionen desselben Gewebeabschnitts, darunter normale Melanozyten, Melanome in situ und primäre Melanome aus der radialen und vertikalen Wachstumsphase (Abb. 5a – d). Wir fanden eine hohe quantitative Reproduzierbarkeit unter biologischen Replikaten, was zu Krankheitszustands- und regionsspezifischen Proteomen führte (Abb. 5e – g). Präkanzeröses (Melanom in situ) und primäres Melanom zeigten Unterschiede in den Proteinen, die an der Signalübertragung von Immunzellen und dem Zellstoffwechsel beteiligt sind, und gingen mit einer verringerten Melanogenese einher (Ergänzungstabelle 7 und erweiterte Daten, Abb. 5d). Die fortgeschrittenen Stadien (radiale und vertikale Melanomwachstumsphase) zeigten eine klar definierte Aktivierung der Stoffwechselaktivierung zusammen mit dem Fortschreiten der Krankheit, ein bekanntes Kennzeichen menschlicher Krebserkrankungen31. Die Expression von Proteinen, die an der oxidativen Phosphorylierung und der Mitochondrienfunktion beteiligt sind, nahm allmählich von Melanozyten, Melanom in situ bis hin zu invasivem Melanom zu, was auf eine Abhängigkeit von der Mitochondrienatmung in fortgeschrittenen Tumorstadien hinweist (Abb. 5h – j, erweiterte Daten Abb. 5c und Ergänzungstabellen 7– 9). Umgekehrt waren Proteine, die an der Antigenpräsentation und der Interferonreaktion beteiligt sind, im Vergleich zum Melanom in situ herunterreguliert (Abb. 5h–j und Ergänzungstabellen 7–9), was den Immunevasionsstrategien beim Melanom entspricht32.

a, DVP-Probenisolierungs-Workflow zur Profilierung primärer Melanome. b, DVP angewendet auf primäres Melanom, immunhistochemisch gefärbt auf den Melanozytenmarker SOX10 und den Melanommarker CD146. Linkes Bild: gefärbtes Melanomgewebe auf einem PEN-Glasmembranobjektträger. Rechtes Feld: Pathologiegesteuerte Annotation verschiedener Geweberegionen. Maßstabsleiste, 1 mm. c, Pathologengesteuerte und ML-basierte Zellklassifizierung basierend auf CD146- und SOX10-Färbeintensität und räumlicher Lokalisierung: normale Melanozyten, Stromazellen, Melanom in situ, CD146-niedriges Melanom, CD146-hohes Melanom, radial wachsendes Melanom und vertikal wachsendes Melanom. Rechtes unteres Feld: Häufigkeit von Klassen, vorhergesagt durch unbeaufsichtigtes ML (k-Means-Clustering). d, Beispielbilder der sieben identifizierten Klassen. Vergrößerungsfaktor = ×4.400. e, Korrelationsmatrix (Pearson r) aller 27 gemessenen Proteomproben. f, PCA von Proteomen. g, PCA aller Melanom-spezifischen Proteome vom In-situ- bis zum invasiven (vertikal wachsenden) Melanom. h, unbeaufsichtigtes hierarchisches Clustering basierend auf allen 1.910 ANOVA-signifikanten (FDR < 0,05) Proteingruppen. Zwei Cluster hochregulierter (Cluster A) bzw. herunterregulierter (Cluster B) Proteine ​​beim invasiven Melanom werden hervorgehoben. i, Gewebe-Heatmap, die die Proteomik-Ergebnisse auf die Bilddaten abbildet. Die relativen Pfadniveaus ausgewählter Begriffe aus den beiden Clustern werden in i hervorgehoben. Die mittleren Proteingehalte wurden pro Anmerkung berechnet und für jede isolierte Zellklasse gegen ihre x- und y-Koordinaten aufgetragen, die durch ihre segmentierten Zellkonturen definiert sind. j, Boxplots der z-bewerteten Proteinmengen für die in i oben dargestellten unterschiedlich regulierten Signalwege. Die Boxplots definieren den Bereich der Daten (Whisker), das 25. und 75. Perzentil (Box) und die Mediane (durchgezogene Linie). Ausreißer werden als einzelne Punkte außerhalb der Whiskers dargestellt. k, Vergleich der proteomischen Veränderungen in Melanomzellen mit hohem CD146-Gehalt (Klasse 4) des vertikalen Wachstums (Region 2) mit dem radialen Wachstum (Region 1). Blutgefäße in der Nähe von Melanomzellen des vertikalen Wachstums werden rot hervorgehoben. Maßstabsleiste, 1 mm. l, Darstellung der Gen-Set-Anreicherungsanalyse der signifikant angereicherten Signalwege für Melanomzellen in der vertikalen und radialen Wachstumsphase. Die Pathway-Anreicherungsanalyse basierte auf der Proteinfaltungsänderung zwischen vertikalen und radialen Melanomzellen und wurde mit dem ClusterProfiler R-Paket durchgeführt36. Angereicherte Begriffe mit einem FDR < 0,05 werden angezeigt. MHC, Haupthistokompatibilitätskomplex.

Das Fortschreiten des Melanoms ist ein schrittweiser Prozess, der radiale und vertikale Wachstumsphasen umfasst. Der direkte Vergleich dieser räumlich definierten Regionen desselben Phänotyps (Zellen der Klasse 4) verdeutlichte außerdem kritische Merkmale der Krebsmetastasierung, wie z. B. die Umgestaltung der extrazellulären Matrix (ECM) (z. B. Kollagenabbau) und die hochregulierte PDGF-Signalübertragung33 (Abb. 5k, l). , Erweiterte Daten Abb. 5e und Ergänzungstabelle 10). Diese tumorbedingten Veränderungen unterstützen das Wachstum, erhöhen die Migration von Tumorzellen und gestalten die ECM um, um die Metastasierung in entfernte Organe über benachbarte Blutgefäße zu erleichtern33. DVP entdeckte außerdem eine signifikante Hochregulierung des mRNA-Spleißens in der vertikalen Wachstumsphase im Vergleich zur radialen Wachstumsphase. Proonkogenes alternatives Spleißen ist in letzter Zeit zu einer therapeutischen Strategie in der Onkologie geworden34, und diese Tumoren weisen häufig immunogene Neoantigene auf35. Die Zunahme des Spleißens fiel mit einer erheblichen Herunterregulierung der immunbezogenen Signalübertragung (Interferonsignalisierung und Antigenpräsentation) zusammen (Abb. 5l und Ergänzungstabelle 10), was auf den Übergang von einer immunogenen „heißen“ zu einer „kalten“ Tumorzone in der Vertikalen hindeutet Wachstumsphase innerhalb desselben Tumorabschnitts. Offensichtlich löste DVP die Tumorheterogenität räumlich auf, indem es tumorbedingtes mRNA-Spleißen, Immunantworten und ECM-Remodellierungswege in verschiedenen Regionen lokalisierte.

DVP kombiniert Bildgebungstechnologien mit unvoreingenommener Proteomik, um die Anzahl exprimierter Proteine ​​in einer bestimmten Zelle zu quantifizieren, Gewebe- oder zelltypspezifische Proteome zu kartieren oder Ziele für zukünftige Medikamente und Diagnostika zu identifizieren. Wir haben gezeigt, wie unsere Analysen einen reichhaltigen „Mikrokosmos in einer Folie“ beschreiben, wichtige Signalwege aufdecken, die bei der Krebsprogression fehlreguliert sind, und die „digitale Pathologie“ effektiv um eine molekulare Dimension erweitern. Es ist allgemein auf jedes biologische System anwendbar, das mikroskopisch abgebildet werden kann, von der Zellkultur bis zur Pathologie. Da ein einzelner Objektträger Hunderttausende Zellen umfassen kann, kann DVP seltene Zellzustände und Interaktionen entdecken und charakterisieren. Im Gegensatz zur Einzelzell-Transkriptomik kann DVP die subzellulären Strukturen und räumlichen Dynamiken der ECM leicht analysieren. Mit weiteren Verbesserungen in der Proteomik-Technologie dürfte DVP auch für die Untersuchung von Proteoformen und posttranslationalen Modifikationen auf der Ebene einzelner Zelltypen geeignet sein.

Wir haben archivierte FFPE-Gewebeproben von Speicheldrüsen-Azinuszellkarzinomen und Melanomen aus der Abteilung für Pathologie des Universitätskrankenhauses Zealand in Roskilde, Dänemark, gesammelt. Das Melanomgewebe stammte von einem 51-jährigen Mann und befand sich im linken oberen Brustbereich. Das TNM-Stadium zum Zeitpunkt der Diagnose war T3aN1M0. Der histologische Subtyp war ein sich oberflächlich ausbreitendes Melanom; der Clark-Wert betrug 4; und die Breslow-Dicke betrug 2,27 mm. Die Tumorimmuninfiltration wurde als nicht rasch eingestuft. Die FFPE-Probe war 17 Jahre alt. Der Patient erlitt 17 Monate nach der Diagnose ein Rezidiv an verschiedenen Stellen und verstarb nach 71 Monaten. Das Azinuszellkarzinom wurde aus der rechten Ohrspeicheldrüse eines 29-jährigen Mannes entfernt. Es gab keine Anzeichen einer Mitose, einer Nekrose-Dedifferenzierung oder eines perineuralen oder intravaskulären Wachstums. Die Tumorzellen waren positiv in EpCAM, CK7, DOG1 und SOX10. Mammaglobin war negativ. Die Probe war 4 Jahre alt und der Patient ist derzeit krankheitsfrei. Die Studie wurde gemäß den institutionellen Richtlinien mit Genehmigung des örtlichen Medical Ethics Review Committee (SJ-742) und der Datenschutzbehörde (REG-066-2019) sowie in Übereinstimmung mit dänischem Recht (Gesetz über medizinische Forschung an menschlichen Probanden) durchgeführt. . Das in Abb. 2 gezeigte Eileitergewebe stammt von einer 64-jährigen Frau und erschien makroskopisch und histologisch normal. Alle Patienten stimmten vor der Operation zu. Von Patienten stammende Gewebe wurden frisch oder in Paraffin eingebettet gemäß einem genehmigten Protokoll des Institutional Review Board (13372B) am Krankenhaus der University of Chicago entnommen. Gemäß der Genehmigung des Medical Ethics Review Committee waren alle FFPE-Gewebeproben menschlicher Patienten von der Einwilligung ausgenommen, da in diesen Studien vorhandene archivierte pathologische Proben verwendet wurden. Menschliche Gewebeproben wurden von einem staatlich geprüften Pathologen beurteilt.

Die menschliche Osteosarkom-Zelllinie U2OS wurde in DMEM (hoher Glucosegehalt, GlutaMAX) mit 10 % FBS und Penicillin-Streptomycin (Thermo Fisher Scientific) gezüchtet.

Die U2OS FUCCI-Zellen wurden freundlicherweise von Atsushi Miyawaki14 zur Verfügung gestellt. Diese Zellen sind endogen mit zwei fluoreszierenden Proteinen markiert, die mit den Zellzyklusregulatoren CDT1 (mKO2-hCdt1+) und Geminin (mAG-hGem+) fusioniert sind. CDT1 reichert sich während der G1-Phase an, während sich Geminin in der S- und G2-Phase ansammelt, was eine Überwachung des Zellzyklus ermöglicht. Die Zellen wurden bei 37 °C in einer mit 5,0 % CO2 befeuchteten Umgebung in McCoys 5A (modifiziertem) Medium GlutaMAX-Ergänzung (Thermo Fisher Scientific, 36600021), ergänzt mit 10 % FBS (VWR), ohne Antibiotika kultiviert.

U2OS-Zellen, die stabil eine auf die Membran gerichtete Form von eGFP exprimieren, wurden durch Transfektion mit dem Plasmid Lck-GFP (Addgene, 61099 (Lit. 37)) und Kultivierung in Selektionsmedium (DMEM-Medium mit 10 % FBS, Penicillin-Streptomycin und 400 μg ml) erzeugt −1 Geneticin) unter Bedingungen begrenzter Verdünnung, um einzelne Kolonien zu ergeben. Aus einer einzelnen Kolonie wurde eine klonale Zelllinie mit homogenen und moderaten Expressionsniveaus von Lck-eGFP an der Plasmamembran etabliert.

Alle Zelllinien wurden auf Mykoplasmen getestet (MycoAlert, Lonza) und durch STR-Profiling (IdentiCell) authentifiziert.

Membran-PEN-Objektträger 1.0 (Zeiss, 415190-9041-000) wurden 1 Stunde lang mit UV-Licht behandelt und mit APES (3-Aminopropyltriethoxysilan) unter Verwendung von VECTABOND-Reagenz (Vector Labs, SP-1800-7) gemäß dem Protokoll des Herstellers beschichtet. FFPE-Gewebeschnitte wurden geschnitten (2,5 µm), über Nacht bei 37 °C luftgetrocknet und 20 Minuten lang auf 60 °C erhitzt, um eine bessere Gewebehaftung zu ermöglichen. Anschließend wurden die Schnitte entparaffiniert, rehydriert und nass auf das vollautomatische Instrument Omnis (Dako) geladen. Die Antigengewinnung wurde unter Verwendung einer 1:10 verdünnten und 60 Minuten lang auf 90 °C erhitzten Target Retrieval Solution pH 9 (Dako, S2367) durchgeführt. Einzelfärbung für EpCAM (Nordic BioSite, Klon BS14, BSH-7402-1, Verdünnung 1:400) und sequentielle Doppelfärbung für SOX10/CD146 (SOX10, Nordic BioSite, Klon BS7, BSH-7959-1, Verdünnung 1:200; CD146, Cell Marque, Klon EP54, AC-0052, Verdünnung 1:400) wurde durchgeführt und die Objektträger wurden 30 Minuten lang (32 °C) inkubiert. Nach dem Waschen und Blockieren der endogenen Peroxidaseaktivität wurden die Reaktionen mit dem EnVision FLEX, High pH Kit (Dako, GV800 und GV809/GV821) gemäß den Anweisungen des Herstellers nachgewiesen und visualisiert. Bei der Doppelfärbung wurden die Substratchromogensysteme EnVision DAB (Dako, GV825) und EnVision Magenta (Dako, GV900) zur Visualisierung von CD146 bzw. SOX10 verwendet. Abschließend wurden die Objektträger mit Wasser gespült, mit Mayer-Hämatoxylin gegengefärbt und ohne Montage an der Luft getrocknet.

FFPE-Gewebeschnitte wurden geschnitten (2,5 µm), auf beschichtete Objektträger (Agilent/Dako, K8020) gelegt und vertikal an der Luft getrocknet, bevor sie 20 Minuten lang auf 60 °C erhitzt wurden, um die Gewebehaftung zu erleichtern. Als nächstes wurden die Objektträger auf das vollautomatische Instrument Omnis geladen. Die Schnitte wurden entparaffiniert und die Antigengewinnung mit Target Retrieval Solution High pH (Agilent/Dako, GV804, verdünnt 1:50) bei 97 °C für 24 Minuten durchgeführt. Anschließend wurden die Schnitte mit den Primärantikörpern inkubiert. Wir haben Antikörper ausgewählt, die von einem zertifizierten Pathologen beurteilt und genehmigt wurden. Protoonkogen-Tyrosin-Proteinkinase SRC/c-Src (Cell Signaling Technology, Klon 36D10, 2109, Verdünnung 1:3.200), Fettsäuresynthase/FASN (Cell Signaling Technology, Klon C20G5, 3180, Verdünnung 1:100), Calponin- 1/CNN1 (Cell Marque, Klon EP63, AC-0060, Verdünnung 1:300) und Cytokeratin 5/CK5 (Leica Biosystems, Klon XM26, NCL-L-CK5, Verdünnung 1:200) für 30 Minuten bei 32 °C. Nach dem Waschen und Blockieren der endogenen Peroxidaseaktivität wurden die Reaktionen mit dem EnVision FLEX, High pH Kit (Agilent/Dako, GV800 und GV809/GV821) gemäß den Anweisungen des Herstellers nachgewiesen und visualisiert. Abschließend wurden die Objektträger mit Wasser abgespült, mit Mayer-Hämatoxylin gegengefärbt und abgedeckt.

Die Zellen wurden zunächst 20 Minuten lang mit 5-Ethinyl-2′-desoxyuridin (EdU) inkubiert und dann 5 Minuten lang bei Raumtemperatur mit 4 % Paraformaldehyd (PFA) fixiert und dreimal mit PBS gewaschen. Anschließend wurden die Zellen mit PBS/0,2 % Triton X-100 2 Minuten lang auf Eis permeabilisiert und dreimal mit PBS gewaschen. Anschließend wurden die Zellen mit einem EdU-Markierungskit (Life Technologies) gefärbt und 10 Minuten lang mit Hoechst 33342 gegengefärbt. Die Objektträger wurden mit GB-Mount (GBI Labs, E01-18) montiert.

Für Validierungsexperimente (Extended Data Abb. 3) wurden 96-Well-Glasbodenplatten (Greiner SensoPlate Plus, Greiner Bio-One) 1 Stunde lang bei Raumtemperatur mit 12,5 µg ml−1 menschlichem Fibronektin (Sigma-Aldrich) beschichtet . Die Immunzytochemie wurde nach einem etablierten Protokoll durchgeführt38. Anschließend wurden 8.000 U2OS-Zellen in jede Vertiefung ausgesät und 24 Stunden lang in einer Umgebung mit 37 °C und 5 % CO2 inkubiert. Die Zellen wurden mit PBS gewaschen, mit 40 µl 4 % eiskaltem PFA fixiert und mit 40 µl 0,1 Triton X-100 in PBS 3×5 Minuten lang permeabilisiert. Polyklonale Kaninchen-HPA-Antikörper, die auf die Proteine ​​von Interesse abzielen, wurden zusammen mit primären Markerantikörpern (siehe unten) in Blockierungspuffer (PBS + 4 % FBS) auf 2–4 µg ml−1 verdünnt und über Nacht bei 4 °C inkubiert. Die Zellen wurden 4 × 10 Minuten lang mit PBS gewaschen und mit Sekundärantikörpern (Ziege-Anti-Kaninchen-Alexa-Fluor-488 (A11034, Thermo Fisher Scientific), Ziege-Anti-Maus-Alexa-Fluor-555 (A21424, Thermo Fisher Scientific) und Ziege-Anti-Huhn inkubiert Alexa Fluor 647 (A21449, Thermo Fisher Scientific)) in Blockierungspuffer bei 1,25 µg ml−1 für 90 Minuten bei Raumtemperatur. Die Zellen wurden 15 Minuten lang in 0,05 µg ml-1 DAPI gegengefärbt, 4×10 Minuten lang damit gewaschen und in PBS eingelegt.

Folgende Primärantikörper wurden verwendet:

Für die Validierung des C7orf50-Zellzyklus: Maus-Anti-ANLN bei 1,25 µg ml−1 (amab90662, Atlas Antibodies)

Maus-Anti-CCNB1 bei 1 µg ml−1 (610220, BD Biosciences)

Kaninchen-Anti-C7orf50 bei 1 µg ml−1 (HPA052281, Atlas Antibodies)

Für menschliches Eileitergewebe wurden FFPE-Gewebeschnitte (2,5 µm) montiert und wie oben beschrieben vorverarbeitet. Danach wurde das Gewebe entparaffiniert, indem es 2×2 Minuten lang in 100 % Xylol gewaschen wurde, gefolgt von einer Reihe von 100 %, 95 % und 70 % Ethanol für jeweils 1 Minute und 3×1 Minute in ddH2O. Die Antigengewinnung wurde in einem Wasserbad unter Verwendung von EDTA-Gewinnungspuffer (1 mM EDTA, 0,05 % Tween 20, pH 8,0) bei 95 °C für 1 Stunde durchgeführt. Im Anschluss an eine Abkühlphase von 1 Stunde bei Raumtemperatur erfolgte die Blockierung mit 10 % Ziegenserum in TBST für 1 Stunde bei Raumtemperatur. Primärantikörper gegen FOXJ1 (Maus, Verdünnung 1:200, 14-9965-80, Invitrogen) und EpCAM (Kaninchen, Verdünnung 1:200, 14452, Cell Signaling Technology) wurden in 10 % Ziegenserum verdünnt und über Nacht bei 4 °C inkubiert in einer befeuchteten Kammer. Gewebeproben wurden 5x in TBST und Sekundärantikörpern zur Visualisierung von FOXJ1 (Alexa Fluor 647 Ziegen-Anti-Maus, Verdünnung 1:200, A21235, Invitrogen) und EpCAM (Alexa Fluor 555 Ziegen-Anti-Kaninchen, Verdünnung 1:200) gewaschen. A21428, Invitrogen) und SYTO 10 zur Kernvisualisierung (10624243, Invitrogen) wurden 1 Stunde lang bei Raumtemperatur im Dunkeln angewendet. Die Proben wurden 5x in TBST gewaschen, gefolgt von 2x in TBS und für die Bildgebung mit hohem Inhalt mit einem Deckglas versehen.

Bilder von immunfluoreszenzmarkierten Zellkulturen wurden mit einem AxioImager Z.2-Mikroskop (Zeiss) aufgenommen, das mit Weitfeldoptik, einem ×20, 0,8 NA-Trockenobjektiv und einem Vierbandfiltersatz für Hoechst, FITC, Cy3 und Cy5 ausgestattet war Fluoreszenzfarbstoffe. Die Weitfeldaufnahme wurde mit der LED-Lichtquelle Colibri 7 und einer Monokamera AxioCam 702 mit 5,86 μm pro Pixel durchgeführt. Z-Stapel mit 19 Z-Schnitten wurden in 3-mm-Schritten aufgenommen, um die optimale Fokusebene zu erfassen. Bilder wurden automatisch mit Zeiss ZEN 2.6 (Blue Edition) bei nicht sättigenden Bedingungen (12-Bit-Dynamikbereich) aufgenommen.

IHC-Bilder aus Speicheldrüsen- und Melanomgewebe wurden mit dem automatischen Objektträgerscanner Zeiss Axio Scan.Z1 für die Hellfeldmikroskopie aufgenommen. Die Hellfelderfassung wurde mit der VIS-LED-Lichtquelle und einer CCD-Hitachi-HV-F202CLS-Kamera durchgeführt. PEN-Objektträger wurden mit einem ×20, 0,8 NA Trockenobjektiv gescannt, was eine Auflösung von 0,22 mm pro Pixel ergab. Z-Stapel mit acht Z-Schnitten wurden in 2-mm-Schritten aufgenommen, um die optimale Fokusebene zu erfassen. Farbbilder wurden automatisch mit Zeiss ZEN 2.6 (Blue Edition) bei nicht sättigenden Bedingungen (12-Bit-Dynamikbereich) erstellt.

Die Zellen wurden auf einem Leica Dmi8-Weitfeldmikroskop abgebildet, das mit einem 0,8 NA, ×40-Luftobjektiv und einer Hamamatsu Flash 4.0 V3-Kamera unter Verwendung der LAS X-Software ausgestattet war. Die Segmentierung jeder Zelle wurde mit der Cell Profiler-Software8 unter Verwendung von DAPI für die Kernsegmentierung durchgeführt. Im Zellkern wurde die mittlere Intensität des Zielproteins und des Zellzyklus-Markerproteins gemessen. Die Zellen wurden unter Verwendung des 0,2- und 0,8-Quantils der ANLN- oder CCNB1-Intensitätsniveaus im Zellkern in die G1- und G2-Phasen des Zellzyklus eingeteilt, und die zellzyklusabhängige Expression von C7orf50 wurde durch Vergleich der Unterschiede in den Expressionsniveaus zwischen G1 validiert und G2-Zellen.

Um Zellen oder Kerne herauszuschneiden, verwendeten wir das Leica LMD7-System, das wir für die automatisierte Einzelzellautomatisierung angepasst haben. Eine hohe Schnittpräzision wurde mit einem HC PL FLUOTAR L ×63/0,70 (Gewebe) oder ×40/0,60 (Zellkulturen) CORR XT-Objektiv erreicht. Wir verwendeten die Software Leica Laser Microdissection V 8.2.3.7603 (angepasst für dieses Projekt) zur vollautomatischen Exzision und Erfassung von Konturen. Für die FFPE-Gewebeproteomanalyse haben wir 50–100 Zellen pro Probe gesammelt (gesammelte Gesamtfläche × Objektträgerdicke / durchschnittliches Säugetierzellvolumen von 2.000 µm3; BNID 100434), in Übereinstimmung mit Schätzungen in der räumlichen Transkriptomanalyse39.

Leica LMD7 Schnittgenauigkeit (Leica R&D, Patent EP1276586)

Für ×150-Objektiv: \({\frac{10}{150}} = 0,07\,\upmu{\mathrm{m}}\)

nucleAIzer3-Modelle wurden in BIAS integriert und für diese Experimente angepasst, indem die Kern- und Zytoplasma-Segmentierungsmodelle neu trainiert und verfeinert wurden. Zunächst wurde das Stiltransfer5-Lernen wie folgt durchgeführt. Angesichts eines neuen experimentellen Szenarios wie unserer immunhistochemisch gefärbten Melanom- oder Speicheldrüsengewebeschnitte erzeugt deren Erfassung einen solchen Bildtyp, für den keine annotierten Trainingsdaten existieren, was eine effiziente Segmentierung selbst mit leistungsstarken DL-Methoden verhindert. Bei einer anfänglichen Segmentierung oder manuellen Konturierung durch Experten (sog. Annotation) wird ein kleiner Maskendatensatz erfasst (Masken stellen beispielsweise Kerne dar), der zur Generierung neuer (synthetischer) Maskenbilder verwendet wird, sodass die räumliche Verteilung, Dichte und morphologische Eigenschaften der erzeugten Objekte (z. B. Kerne) ähneln denen, die auf den kommentierten Bildern gemessen wurden. Die anfänglichen Masken und ihre entsprechenden Mikroskopiebilder werden verwendet, um ein Bildstilübertragungsmodell zu trainieren, das lernt, die Textur der Mikroskopiebilder auf den Masken zu erzeugen und Objekte mithilfe von GANs40 (Generative Adversarial Networks) zu markieren: Vordergrund, um beispielsweise Kerne nachzuahmen und Hintergrund für umgebende, beispielsweise Gewebestrukturen. Parallel dazu wurden künstliche Masken von Kern- oder Zytoplasmaobjekten erstellt und in das Bildstil-Transfer-Lernnetzwerk eingegeben, das realistisch aussehende synthetische Mikroskopiebilder mit dem visuellen Erscheinungsbild des ursprünglichen Experiments erzeugte. Daher ist ihr angewandtes Segmentierungsmodell, Mask R-CNN, mit diesen künstlich erstellten Trainingsdaten (synthetische Mikroskopiebilder und ihre entsprechenden, ebenfalls synthetischen Masken) für den neuen Bildtyp vorbereitet und kann die Zielkompartimente genau segmentieren.

Wir haben die Genauigkeit des Segmentierungsansatzes an einer fluoreszierenden Lck-U2OS-Zelllinie sowie an Gewebeproben von Melanomen, Speicheldrüsen und Eileitern verglichen und die Ergebnisse mit drei weiteren Methoden verglichen, darunter zwei DL-Ansätzen – unet4nuclei (in Abb. als M1 bezeichnet). 2a und S1)6 und Cellpose (M3)7 – neben einer weit verbreiteten, herkömmlichen adaptiven schwellenwertbasierten und objektaufteilungsbasierten Anwendung (M2)8. Wir weisen darauf hin, dass M1 nicht für die Zytoplasmasegmentierung vorgesehen ist (siehe Details in Lit. 6 und unten). Die Segmentierungsgenauigkeit gemäß der F1-Metrik wird als Balkendiagramm angezeigt (Abb. 2b, Erweiterte Daten Abb. 1a, Tabelle 1 und Ergänzungstabelle 1) und es wird auch eine visuelle Darstellung in farbcodierter Form bereitgestellt.

unet4nuclei6 ist für die Segmentierung von Kernen auf Zellkulturbildern optimiert; Cellpose7 ist ein Ansatz, der entweder für die Kern- oder Zytoplasma-Segmentierung auf verschiedenen Mikroskopbildtypen gedacht ist; und CellProfiler8 ist eine konventionelle, auf Schwellenwerten und Objektaufteilung basierende Software, die in der Bioimage-Analyse-Community weit verbreitet ist. unet4nuclei ist, wie der Name schon sagt, in erster Linie für die Kernsegmentierung gedacht und nutzt ein U-Net-basiertes Netzwerk nach Vorverarbeitung der Eingabebilder und anschließender Nachverarbeitung erkannter Objekte. Cellpose verwendet eine Vektorflussdarstellung von Instanzen und sein neuronales Netzwerk (ebenfalls basierend auf U-Net) sagt horizontale und vertikale Flüsse voraus und kombiniert sie. unet4nuclei wurde erfolgreich bei der Kernsegmentierung von Zellkulturen eingesetzt, wohingegen Cellpose in der Lage ist, verschiedene Bildmodalitäten auch außerhalb der Mikroskopie gut zu verallgemeinern und zur Segmentierung von Kernen und Zytoplasmen verwendet werden kann. Wie die meisten Segmentierungsmethoden ist jedoch keine davon in der Lage, sich an eine neue Bilddomäne anzupassen, beispielsweise an einen bestimmten Experimenttyp (z. B. IHC-Speicheldrüsengewebe), ohne erneut auf neu erstellte Ground-Truth-Annotationen zu trainieren. Im Gegenteil, unser Segmentierungsalgorithmus (nucleAIzer3) ist dazu über den oben erwähnten Bildstilübertragungsansatz in der Lage. Offensichtlich können sich herkömmliche Algorithmen auch nicht anpassen; Daher müssen sie für jedes Experiment neu parametrisiert werden. Für die Auswertung wurde ein erfahrener CellProfiler-Benutzer gebeten, eine Pipeline für jeden Probentyp zu optimieren, um das bestmögliche Segmentierungsergebnis zu erzielen, und dann wurden alle Bilder pro Probentyp mit einer Pipeline (entsprechend der gegebenen Probe) segmentiert.

Wir haben unsere Segmentierungsleistung (und Vergleiche) anhand der F1-Score-Metrik bewertet, die beim Schwellenwert von 0,7 IoU (Schnittpunkt über Vereinigung) berechnet wurde. IoU, auch bekannt als Jaccard-Index, wurde aus dem Überlappungsbereich des vorhergesagten (segmentierten) Objekts mit seinem entsprechenden Ground-Truth-(realen) Objekt bei einem bestimmten Schwellenwert berechnet (siehe Formulierung unten). Richtig positive (TP), falsch positive (FP) und falsch negative (FN) Objekte wurden entsprechend gezählt, wenn sie einen IoU hatten, der größer als der Schwellenwert t (in unserem Fall 0,7) war, um zu diesem Zeitpunkt den F1-Score zu erhalten Schwelle (siehe Formulierung unten). Die Segmentierungsauswertung wurde an 10–20 zufällig ausgewählten Bildern aus visuell unterschiedlichen Regionen für jeden Probentyp (U2OS-Zellen und Melanome, Speicheldrüsen- und Eileitergewebe) durchgeführt, um die Robustheit im Vergleich zu Ground-Truth-Anmerkungen zu zeigen, die von Experten mit AnnotatorJ41 erstellt wurden. Um die Robustheit zu gewährleisten, haben wir Bilder von allen relevanten Regionen jeder Probe – zum Beispiel Gangzellen, Acini-Zellen, Zellen ohne Membranfärbung und Lymphozyten – im Speicheldrüsengewebe und in ähnlicher Weise auch für die anderen Proben einbezogen. Umrisse oder Konturen aller sichtbaren Objekte (Kern oder Zytoplasma) wurden einzeln gezeichnet und dann in Maskenbilder im gleichen Format exportiert, das die Segmentierung ergab (Instanzsegmentierungsmasken mit zunehmender Grauintensität nach Objekten). Die Ground-Truth-Masken wurden ausschließlich zur Auswertung verwendet; Das oben erwähnte Bildstil-Transfer-Lernen wurde an automatisch abgerufenen Masken der neuen Experimente trainiert. Unter Berücksichtigung der gemessenen mittleren F1-Werte kommen wir zu dem Schluss, dass die in BIAS verfügbare DL-basierte Segmentierungsmethode3 Segmentierungen sowohl auf Kern- als auch auf Zytoplasmaebene in einer höheren Qualität als die verglichenen Methoden erzeugte (siehe Ergebnisse in Abb. 2a, b und Extended Data Abb. 1a).

Unsere Bewertungsergebnisse der Zellkern- und Zellkörpersegmentierung bei Melanom-, Speicheldrüsen- und Eileiterepithelgeweben sowie U2OS-Zellen sind in Tabelle 1 dargestellt.

Diese Ergebnisse korrelieren mit unserer vorherigen Studie3, die eine überlegene Leistung von nucleAIzer bei verschiedenen Bilddatenmodalitäten der Mikroskopie (fluoreszierende Zellkultur, Hämatoxylin- und Eosin-Gewebe und weitere experimentelle Szenarien) im Vergleich zu mehreren Segmentierungsansätzen, darunter beispielsweise M2 und ilastik9, zeigte.

Wir stellen außerdem fest, dass frühere Methoden wie CellProfiler oder ilastik eine genaue Segmentierung von Zellen durchführen können; Darüber hinaus ist die Leistung von M2 bei der Gewebekernsegmentierung bemerkenswert. Andererseits bieten robuste Methoden (z. B. DL-basiert) den Komfort, dass die meisten Parameter nicht zurückgesetzt werden müssen, wenn an Bildern einer anderen Probe oder eines anderen Typs gearbeitet wird.

Zellkulturen (Kerne oder ganze Zellen) und Gewebeproben wurden durch automatisiertes LMD in 384-Well-Platten (Eppendorf, 0030129547) gesammelt. Für die Sammlung verschiedener U2OS-Kernklassen (Abb. 3 und Extended Data Abb. 2 und 3) haben wir Kerngrößenunterschiede (was zu unterschiedlichen Gesamtproteinmengen führt) durch die Anzahl der gesammelten Objekte pro Klasse normalisiert. Im Durchschnitt haben wir 267 Kerne pro Probe gesammelt. Für FFPE-Gewebeproben von Speicheldrüsen und Melanomen (2,5 µm dicke Schnitte mit einem Mikrotom) wurde eine Fläche von 80.000–160.000 µm2 pro Probe für eine geschätzte Anzahl von 100–200 Zellen gesammelt, basierend auf dem durchschnittlichen HeLa-Zellvolumen 2.000 μm3 (BNID 100434).

Als nächstes wurden 20 µl Ammoniumbicarbonat (ABC) in jede Probenvertiefung gegeben und die Platte mit Dichtungsband (Corning, CLS6569-100EA) verschlossen. Nach 10 Sekunden Vortexen wurden die Platten 10 Minuten lang bei 2.000 g zentrifugiert und 30 Minuten (Zellkultur) bzw. 60 Minuten (Gewebe) in einem Thermocycler (Bio-Rad S1000 mit 384-Well-Reaktionsmodul) auf 95 °C erhitzt. bei einer konstanten Deckeltemperatur von 110 °C. Dann wurden 5 µl 5x-Verdauungspuffer (60 % Acetonitril in 100 mM ABC) zugegeben und die Proben weitere 30 Minuten auf 75 °C erhitzt. Die Proben wurden kurz abgekühlt und mit 1 µl LysC versetzt (vorverdünnt in hochreinem Wasser auf 4 ng µl−1) und 4 Stunden lang bei 37 °C im Thermocycler verdaut. Anschließend wurden 1,5 µl Trypsin zugegeben (vorverdünnt in Reinstwasser auf 4 ng µl−1) und über Nacht bei 37 °C im Thermocycler inkubiert. Am nächsten Tag wurde der Aufschluss durch Zugabe von Trifluoressigsäure (TFA, Endkonzentration 1 % v/v) gestoppt und die Proben im Vakuum getrocknet (ca. 1,5 Stunden bei 60 °C). Anschließend wurden 4 µl MS-Ladepuffer (3 % Acetonitril in 0,2 % TFA) zugegeben und die Platte 10 Sekunden lang gevortext und 5 Minuten lang bei 2.000 g zentrifugiert. Die Proben wurden bis zur Flüssigchromatographie-Massenspektrometrie-Analyse (LC-MS) bei –20 °C gelagert.

Wir verwendeten eine Umkehrphasenfraktionierung bei hohem pH-Wert, um eine tiefe U2OS-Zellvorläuferbibliothek für die datenunabhängige MS-Analyse zu generieren (unten). Die Peptide wurden bei pH 10 mit dem Spider-Fractionator42 fraktioniert. Anschließend wurden 30 μg gereinigte Peptide auf einer 30-cm-C18-Säule in 100 Minuten aufgetrennt und mit 90-Sekunden-Auslassventilschaltern in 12 Fraktionen verkettet. Peptidfraktionen wurden vakuumgetrocknet und in MS-Ladepuffer für die LC-MS-Analyse rekonstituiert.

Die LC-MS-Analyse wurde mit einem EASY-nLC-1200-System (Thermo Fisher Scientific) durchgeführt, das an ein modifiziertes Quadrupol-Flugzeit-Massenspektrometer mit eingeschlossener Ionenmobilitätsspektrometrie und etwa fünffach höherem Ionenstrom (timsTOF Pro, Bruker Daltonik) angeschlossen war ) mit einer Nano-Elektrospray-Ionenquelle (CaptiveSpray, Bruker Daltonik). Der Autosampler wurde für die Probenaufnahme von 384-Well-Platten konfiguriert.

Die Peptide wurden auf eine hausintern gepackte 50-cm-HPLC-Säule (75 µm Innendurchmesser, gepackt mit 1,9 µm großen ReproSil-Pur C18-AQ-Silikatkügelchen, Dr. Maisch) geladen.

Die Peptide wurden unter Verwendung eines linearen Gradienten von 5–30 % Puffer B (0,1 % Ameisensäure und 80 % ACN in Wasser in LC-MS-Qualität) in 55 Minuten getrennt, gefolgt von einem Anstieg auf 60 % für 5 Minuten und 10 Minuten Waschen Sie in 95 % Puffer B bei 300 nl min−1. Puffer A bestand aus 0,1 % Ameisensäure in Wasser in LC-MS-Qualität. Die gesamte Gradientenlänge betrug 70 Minuten. Um die Säulentemperatur konstant bei 60 °C zu halten, verwendeten wir einen selbstgebauten Säulenofen.

Die massenspektrometrische Analyse wurde wie bei Brunner et al. beschrieben durchgeführt, entweder im datenabhängigen (ddaPASEF) (Abb. 4) oder datenunabhängigen (diaPASEF) Modus (Abb. 2, 3 und 5). Für ddaPASEF wurden pro Erfassungszyklus ein MS1-Umfrage-TIMS-MS und zehn PASEF-MS/MS-Scans erfasst. Die Ionenakkumulation und die Rampenzeit im Dual-TIMS-Analysator wurden auf jeweils 100 ms eingestellt, und wir analysierten den Ionenmobilitätsbereich von 1/K0 = 1,6 Vs cm−2 bis 0,6 Vs cm−2. Vorläuferionen für die MS/MS-Analyse wurden mit einem 2-Th-Fenster für m/z < 700 und einem 3-Th-Fenster für m/z > 700 in einem gesamten m/z-Bereich von 100–1.700 isoliert, indem Quadrupol-Schaltereignisse mit dem Vorläufer synchronisiert wurden Elutionsprofil vom TIMS-Gerät. Die Kollisionsenergie wurde linear als Funktion der zunehmenden Mobilität gesenkt, beginnend von 59 eV bei 1/K0 = 1,6 Vs cm−2 bis 20 eV bei 1/K0 = 0,6 Vs cm−2. Einfach geladene Vorläuferionen wurden mit einem Polygonfilter (otof control, Bruker Daltonik) ausgeschlossen. Vorläufer für MS/MS wurden bei einem Intensitätsschwellenwert von 1.000 willkürlichen Einheiten (au) ausgewählt und neu sequenziert, bis ein „Zielwert“ von 20.000 au erreicht wurde, wobei ein dynamischer Ausschluss einer 40-Sekunden-Elution berücksichtigt wurde. Für eine datenunabhängige Analyse nutzten wir die Korrelation der Ionenmobilität mit m/z und synchronisierten die Elution von Vorläufern aus jedem Ionenmobilitätsscan mit dem Quadrupol-Isolationsfenster. Die Kollisionsenergie stieg linear als Funktion der Ionenmobilität von 59 eV bei 1/K0 = 1,6 Vs cm−2 auf 20 eV bei 1/K0 = 0,6 Vs cm−2. Wir haben die ddaPASEF-Methode zur Bibliotheksgenerierung verwendet.

Massenspektrometrische Rohdateien, die im ddaPASEF-Modus (Abb. 4) erfasst wurden, wurden mit MaxQuant (Version 1.6.7.0)43,44 analysiert. Die UniProt-Datenbank (Version 2019, UP000005640_9606) wurde mit einer Peptidspektralübereinstimmung und einem FDR auf Proteinebene von 1 % durchsucht. Es waren mindestens sieben Aminosäuren erforderlich, einschließlich N-terminaler Acetylierung und Methioninoxidation als variable Modifikationen. Aufgrund der unterlassenen Reduktion und Alkylierung wurde die Cysteincarbamidomethylierung aus festen Modifikationen entfernt. Die Enzymspezifität wurde auf Trypsin mit maximal zwei erlaubten fehlenden Spaltungen eingestellt. Die Massentoleranz für die erste und die Hauptsuche wurde auf 70 ppm bzw. 20 ppm festgelegt. Peptididentifizierungen durch MS/MS wurden durch Abgleich vierdimensionaler Isotopenmuster zwischen den Läufen (MBR) mit einem Retentionszeit-Übereinstimmungsfenster von 0,7 Minuten und einem Ionenmobilitätsfenster von 0,05 1/K0 übertragen. Die markierungsfreie Quantifizierung wurde mit dem MaxLFQ-Algorithmus45 und einer Mindestverhältniszahl von 1 durchgeführt.

Für diaPASEF-Messungen (Abb. 2, 3 und 5) wurden Rohdateien mit DIA-NN46 (Version 1.8) analysiert. Um eine projektspezifische Spektralbibliothek zu erstellen, wurde aus derselben Gewebeprobe eine 24-Fraktionen-Umkehrphasen-fraktionierte Vorläuferbibliothek mit hohem pH-Wert erstellt und im ddaPASEF-Modus erfasst, wie oben beschrieben. Rohdateien wurden mit MSFragger47 unter Standardeinstellungen analysiert (mit der Ausnahme, dass die Cysteincarbamidomethylierung aus festen Modifikationen entfernt wurde), um die in DIA-NN verwendete Bibliotheksdatei zu generieren. Die Bibliothek bestand aus 90.056 Vorläufern, 79.802 Elutionsgruppen und 7.765 Proteingruppen.

Die Analyse der Proteomikdaten wurde mit Perseus48 und in der R-Umgebung durchgeführt (https://www.r-project.org/). Die MaxQuant-Ausgabetabellen wurden vor der Datenanalyse nach „Reverse“, „Nur durch Standortänderung identifiziert“ und „Potenzielle Kontaminanten“ gefiltert. Die Daten wurden streng gefiltert, um Proteine ​​mit nur 30 % oder weniger fehlenden Werten zu behalten (die in der MaxQuant-Ausgabe als 0 angezeigt werden). Fehlende Werte wurden vor der statistischen Prüfung auf der Grundlage einer Normalverteilung (Breite = 0,3; Herunterschalten = 1,8) unterstellt. PCA wurde in R durchgeführt. Für Multiproben- (ANOVA) oder paarweise proteomische Vergleiche (zweiseitiger ungepaarter T-Test) haben wir einen permutationsbasierten FDR von 5 % angewendet, um das Testen mehrerer Hypothesen zu korrigieren. Für den paarweisen proteomischen Vergleich in den Abbildungen wurde ein s0-Wert49 von 0,1 verwendet. 2h und 4e. Die Pathway-Anreicherungsanalyse wurde in Perseus (Ergänzungstabellen 2, 3, 5 und 9; exakter Fisher-Test mit Benjamini-Hochberg-FDR von 0,05) oder ClusterProfiler36 (Ergänzungstabellen 7 und 10), dem ReactomePA-Paket50 und dem WebGestalt-Genset-Analyse-Toolkit ( WebGestaltR)51, jeweils mit einem FDR-Filter von 0,05. Die minimale Kategoriegröße wurde auf 20 und die maximale Größe auf 500 festgelegt.

Um kombinierte Mikroskopie- und MS-basierte Proteomikergebnisse zu visualisieren, haben wir die räumlichen Datendateien für jede vorhergesagte Klasse aus der BIAS-Software exportiert. Dieser Export generiert .xml-Ausgabedateien mit der Geometrie und Position von Zellen innerhalb einer Klasse. Wir haben Python verwendet, um diese Informationen zu extrahieren und sie in einem Datenrahmen zusammenzufassen. Anschließend haben wir den Schwerpunkt (x-y-Koordinaten) jeder Zelle in einem Streudiagramm aufgetragen und die Proteomikdaten überlappt. Um die Ergebnisse der Proteinfunktion im räumlichen Kontext zu visualisieren, führten wir eine REACTOME-Signalweganreicherungsanalyse der generierten Proteomikergebnisse durch und verwendeten normalisierte Anreicherungswerte (Z-Scores) als Farbverlauf, der die Überrepräsentation eines bestimmten Signalwegs widerspiegelt.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Research Reporting Summary.

Die Massenspektrometrie-Proteomikdaten wurden über das PRIDE-Partner-Repository52 mit der Datensatzkennung PXD023904 beim ProteomeXchange-Konsortium hinterlegt. BIAS-Rohdaten, Bild-Rohdaten, ein Demodatensatz und Online-Material zur Installation von BIAS und zur Reproduktion unserer Arbeit können in der BioStudies-Datenbank53 des European Bioinformatics Institute (https://www.ebi.ac.uk/biostudies/) abgerufen werden die Zugangsnummer S-BSST820. Wir haben die UniProt-Datenbank (Version 2019, UP000005640_9606, https://www.uniprot.org) für alle massenspektrometrischen Rohdateisuchen verwendet.

Eine kostenlose kompilierte Version von BIAS mit eingeschränkten Hochdurchsatzfunktionen ist im BioStudies Archive verfügbar (Zugangsnummer S-BSST820), die alle in den beschriebenen Arbeitsabläufen verwendeten Funktionen enthält. Mehrere Hauptkomponenten unserer Arbeit sind in Open-Source-Repositories verfügbar (Ergänzungstabelle 11).

Hériché, J.-K., Alexander, S. & Ellenberg, J. Integration von Bildgebung und Omics: Berechnungsmethoden und Herausforderungen. Annu. Rev. Biomed. Datenwissenschaft. 2, 175–197 (2019).

Artikel Google Scholar

Brunner, A. et al. Ultrahochempfindliche Massenspektrometrie quantifiziert die Veränderungen des Proteoms einzelner Zellen bei Störungen. Mol. Syst. Biol. 18, e10798 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Hollandi, R. et al. nucleAIzer: ein parameterfreies Deep-Learning-Framework für die Kernsegmentierung mithilfe der Bildstilübertragung. Zellsystem 10, 453–458 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Smith, K. & Horvath, P. Aktive Lernstrategien für die phänotypische Profilierung von Bildschirmen mit hohem Inhalt. J. Biomol. Bildschirm. 19, 685–695 (2014).

Artikel PubMed Google Scholar

Isola, P., Zhu, J.-Y., Zhou, T. & Efros, AA Bild-zu-Bild-Übersetzung mit bedingten gegnerischen Netzwerken. Vorabdruck unter https://arxiv.org/abs/1611.07004 (2016).

Caicedo, J. et al. Kernsegmentierung bei Bildgebungsexperimenten: der Data Science Bowl 2018. Nat. Methoden 16, 1247–1253 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Stringer, C., Wang, T., Michaelos, M. & Pachitariu, M. Cellpose: ein generalistischer Algorithmus für die Zellsegmentierung. Nat. Methoden 18, 100–106 (2020).

Artikel PubMed CAS Google Scholar

Carpenter, AE et al. CellProfiler: Bildanalysesoftware zur Identifizierung und Quantifizierung von Zellphänotypen. Genombiol. 7, R100 (2006).

Artikel PubMed PubMed Central CAS Google Scholar

Berg, S. et al. ilastik: interaktives maschinelles Lernen für die (Bio-)Bildanalyse. Nat. Methoden 16, 1226–1232 (2019).

Artikel CAS PubMed Google Scholar

Conrad, C. et al. Micropilot: Automatisierung der Fluoreszenzmikroskopie-basierten Bildgebung für die Systembiologie. Nat. Methoden 8, 246–249 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Zhao, T. et al. Die räumliche Genomik ermöglicht eine multimodale Untersuchung der klonalen Heterogenität in Geweben. Natur 601, 85–91 (2022).

Artikel CAS PubMed Google Scholar

Lengyel, E. Entwicklung und Metastasierung von Eierstockkrebs. Bin. J. Pathol. 177, 1053–1064 (2010).

Artikel PubMed PubMed Central Google Scholar

Kurnit, KC, Fleming, GF & Lengyel, E. Aktualisierungen und neue Optionen in der Behandlung von fortgeschrittenem epithelialem Eierstockkrebs. Obstet. Gynäkologie. 137, 108–121 (2021).

Artikel CAS PubMed Google Scholar

Sakaue-Sawano, A. et al. Visualisierung der räumlich-zeitlichen Dynamik des mehrzelligen Zellzyklusverlaufs. Zelle 132, 487–498 (2008).

Artikel CAS PubMed Google Scholar

Altelaar, AM & Heck, AJ Trends in der ultrasensitiven Proteomik. Curr. Meinung. Chem. Biol. 16, 206–213 (2012).

Artikel CAS PubMed Google Scholar

Coscia, F. et al. Ein optimierter, auf Massenspektrometrie basierender Proteomik-Workflow für groß angelegte FFPE-Gewebeanalysen. J. Pathol. 251, 100–112 (2020).

Artikel CAS PubMed Google Scholar

Meier, F. et al. diaPASEF: parallele Akkumulation – serielle Fragmentierung kombiniert mit datenunabhängiger Erfassung. Nat. Methoden 17, 1229–1236 (2020).

Artikel CAS PubMed Google Scholar

Lundberg, E. & Borner, GHH Räumliche Proteomik: ein leistungsstarkes Entdeckungswerkzeug für die Zellbiologie. Nat. Rev. Mol. Zellbiol. 20, 285–302 (2019).

Artikel CAS PubMed Google Scholar

Mahdessian, D. et al. Raumzeitliche Analyse des Zellzyklus mit Einzelzell-Proteogenomik. Natur 590, 649–654 (2021).

Artikel CAS PubMed Google Scholar

Uhlen, M. et al. Gewebebasierte Karte des menschlichen Proteoms. Wissenschaft 347, 1260419–1260419 (2015).

Artikel PubMed CAS Google Scholar

Venturini, V. et al. Der Zellkern misst Formänderungen für die zelluläre Propriozeption, um das dynamische Zellverhalten zu steuern. Science 370, eaba2644 (2020).

Arias-Garcia, M., Rickman, R., Sero, J., Yuan, Y. & Bakal, C. Das Zell-Zell-Adhäsionsprotein JAM3 bestimmt die Kernverformbarkeit durch Regulierung der Mikrotubuli-Organisation. Vorabdruck unter https://www.biorxiv.org/content/10.1101/689737v2.full (2020).

Kokkat, TJ, Patel, MS, McGarvey, D., Livolsi, VA & Baloch, ZW Archivierte formalinfixierte, in Paraffin eingebettete (FFPE) Blöcke: eine wertvolle, wenig genutzte Ressource für die Extraktion von DNA, RNA und Protein. Biokonserv. Biobank 11, 101–106 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Niazi, MKK, Parwani, AV & Gurcan, MN Digitale Pathologie und künstliche Intelligenz. Lancet Oncol. 20, e253–e261 (2019).

Artikel PubMed PubMed Central Google Scholar

Zhu, S., Schuerch, C. & Hunt, J. Übersicht und Aktualisierungen der Immunhistochemie bei ausgewählten Speicheldrüsen- und Kopf-Hals-Tumoren. Bogen. Pathol. Labor. Med. 139, 55–66 (2015).

Artikel PubMed Google Scholar

Kim, LC, Song, L. & Haura, EB Src-Kinasen als therapeutische Ziele für Krebs. Nat. Rev. Clin. Oncol. 6, 587–595 (2009).

Artikel PubMed CAS Google Scholar

Shain, AH et al. Die genetische Entwicklung von Melanomen aus Vorläuferläsionen. N. engl. J. Med. 373, 1926–1936 (2015).

Artikel PubMed CAS Google Scholar

Pollock, PM et al. Hohe Häufigkeit von BRAF-Mutationen in Nävi. Nat. Genet. 33, 19–20 (2003).

Artikel CAS PubMed Google Scholar

Raamsdonk, CDV et al. Häufige somatische Mutationen von GNAQ bei Aderhautmelanomen und blauen Nävi. Natur 457, 599–602 (2009).

Artikel PubMed CAS Google Scholar

Wang, Z. et al. CD146, von einem Melanomzelladhäsionsmolekül zu einem Signalrezeptor. Signalübertragung. Ziel Ther. 5, 148 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Kumar, PR, Moore, JA, Bowles, KM, Rushworth, SA & Moncrieff, MD Mitochondriale oxidative Phosphorylierung beim Hautmelanom. Br. J. Krebs 124, 115–123 (2021).

Artikel PubMed Google Scholar

Eddy, K. & Chen, S. Überwindung der Immunevasion beim Melanom. Int. J. Mol. Wissenschaft. 21, 8984 (2020).

Artikel CAS PubMed Central Google Scholar

Winkler, J., Abisoye-Ogunniyan, A., Metcalf, KJ & Werb, Z. Konzepte der Umgestaltung der extrazellulären Matrix bei Tumorprogression und Metastasierung. Nat. Komm. 11, 5120 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Zhang, Y., Qian, J., Gu, C. & Yang, Y. Alternatives Spleißen und Krebs: eine systematische Übersicht. Signalübertragung. Ziel Ther. 6, 78 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Frankiw, L., Baltimore, D. & Li, G. Alternatives mRNA-Spleißen in der Krebsimmuntherapie. Nat. Rev. Immunol. 19, 675–687 (2019).

Artikel CAS PubMed Google Scholar

Yu, G., Wang, LG, Han, Y. & He, QY ClusterProfiler: ein R-Paket zum Vergleich biologischer Themen zwischen Genclustern. OMICS 16, 284–287 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Benediktsson, AM, Schachtele, SJ, Green, SH & Dailey, ME Ballistische Markierung und dynamische Bildgebung von Astrozyten in organotypischen Hippocampus-Schnittkulturen. J. Neurosci. Methoden 141, 41–53 (2005).

Artikel PubMed Google Scholar

Stadler, C., Skogs, M., Brismar, H., Uhlén, M. & Lundberg, E. Ein einziges Fixierungsprotokoll für proteomweite Immunfluoreszenz-Lokalisierungsstudien. J. Proteomics 73, 1067–1078 (2010).

Artikel CAS PubMed Google Scholar

Moncada, R. et al. Die Integration von Microarray-basierter räumlicher Transkriptomik und Einzelzell-RNA-Seq zeigt die Gewebearchitektur in duktalen Adenokarzinomen der Bauchspeicheldrüse. Nat. Biotechnologie. 38, 333–342 (2020).

Artikel CAS PubMed Google Scholar

Goodfellow, JP-AIJ & Bengio, Y. Generative gegnerische Netzwerke. Proz. Internationale Konferenz über neuronale Informationsverarbeitungssysteme 2672–2680 (2014).

Holland, R., Diosdi, A., Holland, G., Moshkov, N. & Horvath, P. AnnotatorJ: ein ImageJ-Plugin zum einfachen manuellen Kommentieren von Zellkompartimenten. Mol. Biol. Zelle 31, 2179–2186 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Kulak, NA, Geyer, PE & Mann, M. Verlustfreier Nanofraktionator für hochempfindliche Proteomik mit hoher Abdeckung*. Mol. Cell Proteomics 16, 694–705 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Prianichnikov, N. et al. MaxQuant-Software für durch Ionenmobilität verbesserte Shotgun-Proteomik*. Mol. Cell Proteomics 19, 1058–1069 (2020).

Artikel PubMed PubMed Central Google Scholar

Cox, J. & Mann, M. MaxQuant ermöglicht hohe Peptididentifizierungsraten, individuelle Massengenauigkeiten im ppb-Bereich und proteomweite Proteinquantifizierung. Nat. Biotechnologie. 26, 1367–1372 (2008).

Artikel CAS PubMed Google Scholar

Cox, J. et al. Genaue proteomweite, markierungsfreie Quantifizierung durch verzögerte Normalisierung und maximale Peptidverhältnisextraktion, genannt MaxLFQ. Mol. Cell Proteomics 13, 2513–2526 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Demichev, V., Messner, CB, Vernardis, SI, Lilley, KS & Ralser, M. DIA-NN: Neuronale Netze und Interferenzkorrektur ermöglichen eine tiefe Proteomabdeckung bei hohem Durchsatz. Nat. Methoden 17, 41–44 (2020).

Artikel CAS PubMed Google Scholar

Kong, AT, Leprevost, FV, Avtonomov, DM, Mellacheruvu, D. & Nesvizhskii, AI MSFragger: Ultraschnelle und umfassende Peptididentifizierung in der massenspektrometriebasierten Proteomik. Nat. Methoden 14, 513–520 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Tyanova, S. et al. Die Perseus-Rechenplattform für die umfassende Analyse von (Prote-)Omics-Daten. Nat. Methoden 13, 731–740 (2016).

Artikel CAS PubMed Google Scholar

Tusher, VG, Tibshirani, R. & Chu, G. Signifikanzanalyse von Mikroarrays, die auf die Reaktion auf ionisierende Strahlung angewendet werden. Proz. Natl Acad. Wissenschaft. USA 98, 5116–5121 (2001).

Artikel CAS PubMed PubMed Central Google Scholar

Yu, G. & He, Q.-Y. ReactomePA: ein R/Bioconductor-Paket für die Analyse und Visualisierung von Reaktompfaden. Mol. Biosystem. 12, 477–479 (2015).

Artikel CAS Google Scholar

Liao, Y., Wang, J., Jaehnig, EJ, Shi, Z. und Zhang, B. WebGestalt 2019: Gen-Set-Analyse-Toolkit mit überarbeiteten Benutzeroberflächen und APIs. Nukleinsäuren Res. 47, W199–W205 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Perez-Riverol, Y. et al. Die PRIDE-Datenbank und zugehörige Tools und Ressourcen im Jahr 2019: Verbesserung der Unterstützung für Quantifizierungsdaten. Nukleinsäuren Res. 47, D442–D450 (2019).

Artikel CAS PubMed Google Scholar

Sarkans, U. et al. Die BioStudies-Datenbank – eine zentrale Anlaufstelle für alle Daten, die eine biowissenschaftliche Studie unterstützen. Nukleinsäuren Res. 46, D1266–D1270 (2017).

Szklarczyk, D. et al. STRING v11: Protein-Protein-Assoziationsnetzwerke mit erhöhter Abdeckung, die die funktionelle Entdeckung in genomweiten experimentellen Datensätzen unterstützen. Nukleinsäuren Res. 47, D607–D613 (2019).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Die Autoren danken M. Rykær, J. Madsen (NNF CPR Mass Spectrometry Platform, Universität Kopenhagen) und L. Drici (NNF CPR Proteomics Program) sowie J. Mueller (MPIB München) für technische Unterstützung. Wir danken F. Hoffmann, C. Greb und F. Schlaudraff von Leica für technische Unterstützung; T. Danka und M. Kovács für fruchtbare wissenschaftliche Diskussionen; und T. Hartig Braunstein, P. Hernandez-Varas und C. Prats von der Core Facility of Integrated Microscopy für Mikroskopieunterstützung. Wir danken J. Lukas für die wissenschaftliche Unterstützung und Anleitung und J. Percival für die wissenschaftlichen Illustrationen (Illustration Ltd.). Diese Arbeit wurde durch Zuschüsse der Novo Nordisk Foundation (Zuschussvereinbarungen NNF14CC0001 und NNF15CC0001) und der Max-Planck-Gesellschaft zur Förderung der Wissenschaften sowie durch die Chan Zuckerberg Initiative zur teilweisen Finanzierung der Zellzyklusarbeit (Zuschuss CZF2019-002448) an E. unterstützt . Lundberg, MM und PH. FC würdigt das Forschungs- und Innovationsprogramm Horizon 2020 der Europäischen Union im Rahmen der Fördervereinbarung 846795 (Marie-Skłodowska-Curie-Stipendium) und das Bundesministerium für Bildung und Forschung (BMBF) als Teil des Nationalen Forschungsknotens „Massenspektrometrie in der Systemmedizin“ (MSCoreSys). ), gemäß der Finanzhilfevereinbarung 161L0222. BDA dankt der Lundbeck Foundation (R252-2017-1414) und der Novo Nordisk Foundation (NNF20OC0065720) für ihre Unterstützung. PH, RH, FK, EM und AK danken für die Unterstützung durch den LENDULET-BIOMAG-Stipendium (2018-342), den Europäischen Fonds für regionale Entwicklung (GINOP-2.2.1-15-2017-00072) und H2020 (ERAPERMED-COMPASS, ERAPERMED-SYMMETRY). , DiscovAIR, FAIR-CHARM), OTKA-SNN, TKP2021-EGA09 und ELKH-Excellence-Stipendien. E. Lengyel wird vom NIH R35CA264619 und der Chan Zuckerberg Initiative (CZIF2019-002435) unterstützt. Wir danken S. Ito und H. Masai (Tokyo Metropolitan Institute of Medical Science) für die Bereitstellung der stabilen U2OS FUCCI-Zelllinie. Das LCK-GFP-Plasmid war ein Geschenk von S. Green (Addgene, Plasmid 61099).

Open-Access-Förderung durch die Max-Planck-Gesellschaft.

Diese Autoren haben gleichermaßen beigetragen: Andreas Mund, Fabian Coscia.

Proteomics-Programm, Novo Nordisk Foundation Center for Protein Research, Fakultät für Gesundheits- und Medizinwissenschaften, Universität Kopenhagen, Kopenhagen, Dänemark

Andreas Mund, Fabian Coscia, Alberto Santos, Beatrice Dyring-Andersen & Matthias Mann

Spatial Proteomics Group, Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft, Berlin, Deutschland

Fabian Coscia

Abteilung für synthetische und Systembiologie, Biologisches Forschungszentrum, Eötvös Loránd Forschungsnetzwerk, Szeged, Ungarn

András Kriston, Réka Hollandi, Ferenc Kovács, Ede Migh und Peter Horvath

Single-Cell Technologies Ltd., Szeged, Ungarn

András Kriston, Ferenc Kovács und Peter Horvath

Proteomik und Signaltransduktion, Max-Planck-Institut für Biochemie, Martinsried, Deutschland

Andreas-David Brunner, Lisa Schweizer & Matthias Mann

Zentrum für Gesundheitsdatenwissenschaft, Universität Kopenhagen, Kopenhagen, Dänemark

Alberto Santos

Big Data Institute, Li-Ka Shing Centre for Health Information and Discovery, Universität Oxford, Oxford, Großbritannien

Alberto Santos

Abteilung für Pathologie, Universitätskrankenhaus Zealand, Roskilde, Dänemark

Michael Bzorek, Soraya Naimy und Lise Mette Rahbek-Gjerdrum

Institut für klinische Medizin, Universität Kopenhagen, Kopenhagen, Dänemark

Lise Mette Rahbek-Gjerdrum

Abteilung für Dermatologie und Allergie, Herlev und Gentofte Krankenhaus, Universität Kopenhagen, Hellerup, Dänemark

Beatrice Dyring-Andersen

Leo Foundation Skin Immunology Research Center, Fakultät für Gesundheits- und Medizinwissenschaften, Universität Kopenhagen, Kopenhagen, Dänemark

Beatrice Dyring-Andersen

Protein Imaging Platform, Novo Nordisk Foundation Center for Protein Research, Fakultät für Gesundheits- und Medizinwissenschaften, Universität Kopenhagen, Kopenhagen, Dänemark

Jutta Bulkescher & Claudia Lukas

Protein Signaling Program, Novo Nordisk Foundation Center for Protein Research, Fakultät für Gesundheits- und Medizinwissenschaften, Universität Kopenhagen, Kopenhagen, Dänemark

Claudia Lukas

Abteilung für Geburtshilfe und Gynäkologie/Abteilung für gynäkologische Onkologie, University of Chicago, Chicago, IL, USA

Mark Adam Eckert & Ernst Poland

Science for Life Laboratory, School of Engineering Sciences in Chemistry, Biotechnology and Health, KTH – Royal Institute of Technology, Stockholm, Schweden

Christian Gnann & Emma Lundberg

Abteilung für Bioingenieurwesen, Stanford University, Stanford, CA, USA

Emma Lundberg

Chan Zuckerberg Biohub, San Francisco, CA, USA

Emma Lundberg

Institut für Molekulare Medizin Finnland (FIMM), Universität Helsinki, Helsinki, Finnland

Peter Horvath

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Konzeptualisierung: AMFC, PH und MM; Methodik: AM, FC, ADB, MB, BDA und MM; Software: RH, FK, AK und PH; Untersuchung: AM, FC und RH; Formale Analyse: AM, FC und RH; Schreiben – Originalentwurf: AM, FC, PH und MM; Schreiben – Rezension und Bearbeitung: alle Autoren; Ressourcen: alle Autoren.; Datenkuration: LMRG, MB, SN, AM, FC, RH, FK, AK, AS, EM, LS, MAE, E. Lengyel und PH; Visualisierung: AM, FC, AS und RH; Projektverwaltung: AM und PH; Betreuung: MM; Finanzierungseinwerbung: FC, PH, E. Lundberg und MM

Korrespondenz mit Andreas Mund, Peter Horvath oder Matthias Mann.

PH ist Gründer und Anteilseigner von Single-Cell Technologies Ltd., einem Biodatenanalyseunternehmen, das die BIAS-Software besitzt und entwickelt. Die übrigen Autoren erklären keine konkurrierenden Interessen.

Nature Biotechnology dankt den anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

a, Zellkörper- und Kernsegmentierung von Melanom-, Speicheldrüsen- und Eileitergewebe mithilfe der Biological Image Analysis Software (BIAS). Wir haben die Genauigkeit unseres Segmentierungsansatzes mit der F1-Metrik verglichen und die Ergebnisse mit drei weiteren Methoden M1–M3 verglichen. unet4nuclei (M1)6, CellProfiler (M2)8, CellPose (M3)7, während OUR sich auf nucleAIzer3 bezieht. Balken zeigen mittlere F1-Werte mit SEM (Standardfehler des Mittelwerts). Visuelle Darstellung der Segmentierungsergebnisse: Grüne Bereiche entsprechen richtig positiv, blau entspricht falsch positiv und rot entspricht falsch negativ. Daten in Tabelle 1 und Ergänzungstabelle 1. b, BIAS ermöglicht die Verarbeitung mehrerer 2D- und 3D-Mikroskopie-Bilddateiformate. Beispiele für Bildvorverarbeitung, Deep-Learning-basierte Bildsegmentierung, Merkmalsextraktion und maschinelles Lernen-basierte Phänotypklassifizierung. c, links: Konturausrichtung in der LMD7-Software vor der Lasermikrodissektion von Eileiterepithelzellen. Mitte: Screenshot nach der Laser-Mikrodissektion. Rechts: 384-Well-Inspektion nach Laser-Mikrodissektion in einzelnen Eileiterepithelzellen. d, Anzahl der quantifizierten Proteine ​​pro Replikat von FOXJ1-positiven und -negativen Epithelzellen. Die Proben wurden im datenunabhängigen Modus erfasst und mit der DIA-NN-Software analysiert. e, Replizieren Sie Korrelationen von Proteommessungen. Korrelationswerte zeigen Pearson-Korrelationen. f, Pathway-Anreicherungsanalyse für Proteine, die in Flimmerzellen im Vergleich zu sekretorischen Eileiterepithelzellen deutlich höher ist.

a, Quantitative proteomische Ergebnisse von Replikaten ganzer Zellen und Kerne und Vergleich zwischen ganzen Zellen und Kernen. b, Hauptkomponentenanalyse (PCA) von Proteomen ganzer Zellen (n = 3) und Zellkernen (n = 3). Proteine ​​mit dem stärksten Beitrag zu PC1 werden hervorgehoben. c, Relative Anteile der sechs Kernklassen. d, Anzahl der unterschiedlich exprimierten Proteine ​​(zweiseitiger t-Test, n = 3 biologische Replikate) im Vergleich zu nicht klassifizierten Kernen (Masse). Proteine ​​mit einem FDR von weniger als 0,05 wurden als signifikant angesehen. e, Korrelation zwischen der Anzahl signifikant regulierter Proteine ​​pro Kernklasse und dem relativen Klassenanteil. An die Daten wurde ein lineares Modell angepasst, das eine inverse Korrelation mit Pearson r = -0,96 (p-Wert = 0,01) zeigte. f, Relative Proteingehalte (Z-Score) bekannter Zellzyklusmarker in den fünf Kernklassen. Alle Balkendiagramme stellen Mittelwerte der Daten dar (n = 3 biologische Replikate) und Fehlerbalken sind SD-ANOVA-p-Werte.

a, Violindiagramme, die die Kernfläche in Pixeln der 6 durch ML identifizierten Kernklassen zeigen. b, Kernfläche in Pixeln von U2OS-FUCCI-Zellen im Verhältnis zur Zellzyklus-Pseudozeit14. Der Farbcode gibt die Punktdichte an. c, Kernbereich der drei Hauptstadien des Zellzyklus G1, G1/S und S/G2, bestimmt durch fluoreszierend markierte CDT1- und GMNN-Intensitäten und Gaußsche Clusterbildung. Boxplots zeigen die Ergebnisse von insgesamt n = 238.675 Zellen (85.551 für G1, 83.121 für G1/S und 70.003 für S/G2). d, Relative Proteingehalte aller identifizierten ORF-Proteine ​​im Datensatz. C7orf50, C1orf112, C19orf53 und C11orf98 wurden in den 5 Kernklassen (n = 3 biologische Replikate) unterschiedlich exprimiert (ANOVA-p-Wert <0,05). e, Mittlere Intensitäten von immunfluoreszierend gefärbtem C7orf50 und den Zellzyklusmarkern ANLN und CCNB1 in U20S-Zellen. Die C7orf50-Spiegel wurden in Kernen mit niedrigen und hohen ANLN- und CNNB1-Intensitäten quantifiziert. Boxplots zeigen die Ergebnisse von n = 263 Zellen pro Bedingung (C7orf50-ANLN) und n = 412 pro Bedingung (C7orf50-CCNB1). f, Oberes Feld: Repräsentative Immunfluoreszenzbilder von C7orf50- und DNA (DAPI)-gefärbten U2OS-Zellen19. Der Maßstabsbalken beträgt 20 µm. Beachten Sie, dass C7orf50 in Nukleolen angereichert ist. Unteres Feld: Immunhistochemie eines C7orf50-gefärbten Pankreas-Adenokarzinoms (https://bit.ly/2X4re05). Bildnachweis: Human Protein Atlas. Der Maßstabsbalken beträgt 40 µm. g, Kaplan-Meier-Überlebensanalyse des Pankreas-Adenokarzinoms (https://bit.ly/3BAxewA) basierend auf relativen C7orf50-RNA-Spiegeln (FPKM, Anzahl der Fragmente pro Kilobase Exon pro Million Reads). RNA-seq-Daten werden als mittlerer FPKM angegeben, generiert vom Cancer Genome Atlas (https://bit.ly/3iSOG8d). Die Patienten wurden basierend auf den C7orf50-Werten in zwei Gruppen eingeteilt: n = 41 niedrige und n = 135 hohe Patienten. Ein Log-Rank-Test wurde mit p = 0,0001 berechnet. h, String-Interaktom-Analyse für C7orf50. Es wurde ein hoher Konfidenzwert von 0,7 verwendet, wobei die fünf engsten Interaktoren durch Farbe54 hervorgehoben wurden. Die Boxplots in c und e definieren den Bereich der Daten (Whisker), das 25. und 75. Perzentil (Box) und die Mediane (durchgezogene Linie). Ausreißer werden als einzelne Punkte außerhalb der Whiskers dargestellt.

a: Immunhistochemische Färbung einer normalen Speicheldrüse, gefärbt auf das Zelladhäsionsprotein EpCAM. Unter Aufsicht (zufälliger Wald) wurde ML darauf trainiert, Azinuszellen (grün) und Ductuszellen (türkis) zu identifizieren. Maßstabsbalken = 20 µm. b, Quantitativer proteomischer Vergleich zwischen Azinus- und Ductuszellen aus Gewebe in A mit hervorgehobenen bekannten zelltypspezifischen Markern (https://bit.ly/3iOK8Qf). c, Relative Proteingehalte ausgewählter Signalwege, die in Azinus- oder Ductuszellen signifikant höher waren. d, Unbeaufsichtigte hierarchische Clusterung von Azinus- und Ductuszell-Proteomen von zwei verschiedenen Patienten zusammen mit Azinuszellkarzinomzellen. Beachten Sie, dass normale Azinuszellen aus zwei verschiedenen Geweben zusammengeballt sind. Gangzellen gruppierten sich am weitesten entfernt. Vor der Clusterbildung wurden die Proteingehalte verschiedener Probengruppen (Gangzellgewebe Nr. 1, Azinuszellgewebe Nr. 1, Azinuszellgewebe Nr. 2, Karzinomgewebe Nr. 2) gemittelt und mit einem Z-Score bewertet. Der Balken auf der linken Seite zeigt unterschiedlich exprimierte Signalwege aus Panel b mit Acini- und Ductus-spezifischen Proteinen in Grün bzw. Türkis.

a, Isolierung tumornaher SOX10-positiver Melanozyten aus kutanem Melanomgewebe. Links: Konturausrichtung vor der Laser-Mikrodissektion. Rechts: Inspektion nach Laser-Mikrodissektion. b, Anzahl der Proteinquantifizierungen pro Probentyp mit n = 4 (Melanozyten), n = 5 (Stroma), n = 5 (Melanom in situ) und n = 13 (Melanom) unabhängige Replikate. Balkendiagramme stellen den Mittelwert der Daten dar und Fehlerbalken sind Standardabweichungen. Die Proben wurden im datenunabhängigen Modus erfasst und mit der DIA-NN-Software analysiert. c, oberes Feld: Heatmap aus Abb. 5h mit identifizierten Proteinclustern (Farbbalken). Unbeaufsichtigtes hierarchisches Clustering basierend auf allen 1.910 ANOVA-signifikanten (FDR < 0,05) Proteingruppen. Der Proteingehalt wurde mit einem Z-Score bewertet. Unteres Feld: Pathway-Anreicherungsanalyse verschiedener Zeilencluster, erhalten durch unbeaufsichtigtes hierarchisches Clustering. Für die Anreicherungsanalyse wurde das ReactomePA-Paket mit einem FDR-Grenzwert von 0,05 für alle angereicherten Begriffe verwendet. d, Relative Konzentrationen (Z-Score) von Proteinen im Zusammenhang mit dem KEGG-Begriff „Melanogenese“. Beachten Sie, dass Melanozyten den höchsten Proteingehalt aufweisen. Die Boxplots definieren den Bereich der Daten (Whisker), das 25. und 75. Perzentil (Box) und die Mediane (durchgezogene Linie). Ausreißer werden als einzelne Punkte außerhalb der Whiskers dargestellt. e, Pathway-Anreicherungsanalyse von Proteinen, die in Melanomzellen mit vertikalem oder radialem Wachstum hoch- oder runterreguliert sind. Anreicherungsergebnisse wurden mit dem ClusterProfiler R-Paket36 basierend auf einem FDR < 0,05 erzielt.

BIAS-Informationen

Automatisierte LMD-Einzelkernisolierung

Automatisierte LMD-Einzelzellenisolierung

Benchmark-Genauigkeit des Segmentierungsansatzes unter Verwendung der F1-Metrik und Vergleich der Ergebnisse mit drei zusätzlichen Methoden

Signalweganreicherungsanalyse für Proteine, die in Flimmerzellen im Vergleich zu sekretorischen Eileiterepithelzellen deutlich höher ist, basierend auf einem exakten Fisher-Test mit einem Benjamini-Hochberg-FDR < 0,05

Ergebnisse der Pathway-Anreicherungsanalyse für Proteine, die über Kernklassen hinweg unterschiedlich reguliert werden, basierend auf einem exakten Fisher-Test mit einem Benjamini-Hochberg-FDR < 0,05

Proteine, die über Kernklassen hinweg unterschiedlich reguliert werden, basierend auf einer ANOVA-Analyse mit einem permutationsbasierten FDR < 0,05

Ergebnisse der Pathway-Anreicherungsanalyse für Proteine, die unterschiedlich zwischen Azinus- und Ductuszellen der gesunden Speicheldrüse reguliert werden, basierend auf einem zweiseitigen Wilcoxon-Mann-Whitney-Test (zwei Stichproben) mit einem Benjamini-Hochberg-FDR < 0,05

Proteine, die zwischen Azinuszellkarzinomen und normalen Azinuszellen unterschiedlich reguliert werden. Ein zweiseitiger t-Test wurde mit einem permutationsbasierten FDR < 0,05 durchgeführt

Gen-Set-Anreicherungsanalyse von Reactome Pathways (ReactomePA) für Melanome in situ im Vergleich zu primären Melanomen. Es werden Pfade mit einem FDR-bereinigten P-Wert von <0,05 angezeigt

Proteine, die in allen Zellklassen des primären Melanoms unterschiedlich reguliert wurden, basierend auf einer ANOVA-Analyse mit einem permutationsbasierten FDR < 0,05

Ergebnisse der Pathway-Anreicherungsanalyse für Proteine ​​in den beiden hervorgehobenen Heatmap-Clustern von Abb. 5i basierend auf einem exakten Fisher-Test mit einem Benjamini-Hochberg-FDR <0,05

Genset-Anreicherungsanalyse von Reactome Pathways (ReactomePA) für Melanomzellen der vertikalen versus radialen Wachstumsphase. Es werden Pfade mit einem FDR-bereinigten P-Wert von <0,05 angezeigt

Links zu Open-Source-Repositories

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Mund, A., Coscia, F., Kriston, A. et al. Deep Visual Proteomics definiert die Identität und Heterogenität einzelner Zellen. Nat Biotechnol 40, 1231–1240 (2022). https://doi.org/10.1038/s41587-022-01302-5

Zitat herunterladen

Eingegangen: 08. März 2022

Angenommen: 30. März 2022

Veröffentlicht: 19. Mai 2022

Ausgabedatum: August 2022

DOI: https://doi.org/10.1038/s41587-022-01302-5

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Naturmethoden (2023)

Naturmethoden (2023)

Nature Reviews Genetik (2023)

Naturmethoden (2023)

Naturkommunikation (2023)

AKTIE