Computational Analysis and Interpretation of Prokaryotic High-throughput Expression Data

Scheer, Maurice Patrick

Nach der Präprozessierung von Mikroarray-Expressionsdaten erfolgt normalerweise ihre funktionelle Interpretation. Dieses manuell durchzuführen, ist zeitraubend und ein Überblick über die relevanten Funktionen kann so nur schwer gewonnen werden. Daher wurde in dieser Arbeit eine integrative Software-Suite (JProGO) zur funktionellen Auswertung von prokaryotischen Expressiondaten basierend auf der Gene Ontology (GO) entwickelt. Sie identifiziert biologische Funktionen und Prozesse, die sich beim Vergleich zweier Versuchsbedingungen in ihrem Expressionsprofil signifikant unterscheiden. JProGO unterstützt mehr als 20 prokaryotische Spezies und bietet verschiedene statistische Tests an: den Schwellenwert-basierten exakten Fisher-Test und den Schwellenwert-freien t-, Kolmogorov-Smirnov- (KS-Test) und Mann-Whitney U-Test (U-Test). Weitere Funktionen sind Methoden zur Korrektur des multiplen Testeffekts sowie die Unterstützung von Gen-Synonymen und verschiedenen Expressionsdaten-Typen. Die Ergebnisse können als Untergraph von GO visualisiert werden. Das Programm wurde mit Expressionsdaten von Escherichia coli und Bacillus subtilis getestet. Zuerst wurde der Einfluss des Schwellenwertes beim exakten Fisher-Test untersucht. Dann wurden die Schwellenwert-freien Methoden evaluiert, wobei sich der U-Test als gute Alternative zum KS- und t-Test erwies. Nach dieser Evaluierung wurde JProGO für die Analyse von in-house Expressionsdaten des Pathogens Pseudomonas aeruginosa eingesetzt. Es wurde der Einfluss verschiedener Präprozessierungsalgorithmen auf die JProGO-basierte Auswertung untersucht. Zudem wurden einige signifikante GO-Knoten gefunden, die der Erwartung an die Experimente entsprechen. Zuletzt wurde der Ansatz von GO-Gruppen auf Regulons erweitert. Expressionsdaten von E. coli-Stämmen mit ausgeschalteten Transkriptionsfaktoren wurden evaluiert; die Ergebnisse entsprachen der Erwartung gut. Hierbei schnitt der KS-Test am besten ab, dicht gefolgt vom U-Test.

After preprocessing microarray raw expression data normally their functional interpretation follows. Performing this manually is time-consuming and it is hard to get an overview on the relevant functions this way. Therefore, in this thesis an integrative program suite (JProGO) for the functional interpretation of prokaryotic gene expression data based on the Gene Ontology (GO) was developed. It identifies biological functions and processes that significantly differ in their expression profiles when comparing two experimental conditions. JProGO supports more than 20 prokaryotic species and offers several different statistical tests: the cut-off based Fisher's exact test and the cut-off free Student's t-test, Kolmogorov-Smirnov (KS-test) and unpaired Wilcoxon test (U-test). Further features are methods of correcting the multiple testing effect and the support of gene synonyms and of different types of expression data. Obtained results can be visualized as a subgraph of GO. The tool was tested with expression data from Escherichia coli and Bacillus subtilis. First, the influence of the threshold value for the Fisher's exact test was elucidated. Then, the cut-off free methods were comparatively evaluated, whereas the U-test was found as a good alternative to the KS- and t-test. After this evaluation, JProGO was used for the analysis of in-house expression data from the pathogen Pseudomonas aeruginosa. The impact of different preprocessing algorithms on the results of the JProGO-based analysis was investigated. Furthermore, several significant GO nodes were identified that fit the expectation on the experiments. Finally, the approach was expanded from GO terms towards regulons. Expression data from E. coli transcription factor knockout strains were evaluated and the results were in good agreement with the expectation. Here, the KS-test performed best, whereas the U-test was almost as good.

Vorschau

Zitieren

Zitierform:

Scheer, Maurice Patrick: Computational Analysis and Interpretation of Prokaryotic High-throughput Expression Data. 2008.

Zugriffsstatistik

Gesamt:
Volltextzugriffe:
Metadatenansicht:
12 Monate:
Volltextzugriffe:
Metadatenansicht:

Details anzeigen

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten

Export