In HypothesenListe.csv ist eine Übersicht über Hypothesen, welche wir bisher von einer biologischen Hypothesenform in eine statistische Hypothesenform gebracht haben. Bis heute sind nur Thesen von Typ 1 und Typ 2 testbar.
In den folgenden 4 Dateien sind die Verbindungen von unserem bisherigen Textmining und den Projekthypothesen dargestellt.
Die Daten sind untergliedert in Textminingrelationen im CLA-Kontext stehen und die Verbindungen ohne.
In diesen beiden Kategorien gibt es den Vergleich, welche Projekthypothesen mit Hilfe von Textmining in der Literatur auch gefunden worden sind.
Zusätzlich gibt es noch einen Überblick über annotierte Relationen, die bisher keine Verbindung zu den Projekt haben.
Die Combined-Dateien sind wie folgt aufgebaut:
Nr. -> korrespondiert zur Porjektthesennummer in der Datei Projekthypothesen.csv
Overlap -> Yes/No
Organism
PMID -> ist ein Link zu der entsprechenden Stelle in der HTML Datei, die eingefärbte Annotationen enthält
Direction -> annotierte Veränderung in der Relation
Hypothesis Details -> enstpricht den Eintragungen in der Datei Projekthypothesen.csv
In dieser HTML Datei sind alle annotierten Abstacts enthalten. Die PMID ist zu dem Orginaltext verlinkt.
Die annotierten Hits sind nach ihrer jeweiligen Klasse fabrig markiert. Hierbei ist zu beachten,
dass nicht alle farbig markierten Einträge in einer von uns annotierten Relation vorkommen muss.
Der Farbcode ist wie folgt:
fattyacid
biological process
organism
gene
characteristics
cell type