6. In Debian-Med integrierte Software

Wie bereits eingangs erläutert wurde, existieren nicht in allen Teilbereichen der Medizin gleich viele Freie Software Projekte. An dieser Stelle sollen nur die Projekte der Molekularbiologie und medizinischen Genetik sowie der medizinischen Bildverarbeitung aufgelistet werden. Einen vollständigen Überblick über alle Teilbereiche gibt die Debian-Med Webseite.

6.1. Molekularbiologie und medizinische Genetik

Amap

AMAP ist ein Kommandozeilenwerkzeug, um mehrfache Alignments von peptidischen Sequenzen durchzuführen. Es verwendet Posterior-Dekodierung, ein Sequenz-heilendes Alignment anstelle der traditionellen fortschreitenden Alignment-Methoden. Es ist das einzige Alignment-Programm, das erlaubt, den Empfindlichkeit/Genauigkeits-Kompromiß zu kontrollieren. Es basiert auf dem Quellcode von ProbCons, verwendet aber metrische Alignment-Genauigkeit (alignment metric accuracy) und beseitigt die Konsistenz-Transformation.

ARB

Die ARB-Software ist ein grafisch orientiertes Paket, das aus mehreren Werkzeugen für die Bearbeitung von Sequenz-Datenbanken und Datenanalyse besteht. Eine zentrale Datenbank mit bearbeiteten Sequenzen (erstellte Alignments) sowie jegliche Art von zusätzlichen Daten, die mit den entsprechenden Sequenzen zusammenhängen, kann auf Grund der Phylogenetik oder anderen benutzerdefinierten Kriterien strukturiert werden.

BioPerl

Das Bioperl-Projekt ist eine gemeinsame Anstrengung, Berechnungsmethoden zu sammeln, die routinemäßig in der Bioinformatik benutzt werden. Aus dieser Sammlung wird ein Satz von CPAN-artigen, gut dokumentierten und frei verfügbaren Perlmodulen erstellt.

BioPython

Das Biopython-Projekt ist eine internationale Vereinigung von Entwicklern frei verfügbarer Python-Werkzeuge zur Entwicklung von Python-Bibliotheken und -Applikationen, die auf die Anforderungen der aktuellen und zukünftigen Arbeit in der Bioinformatik zugeschnitten sind.

BioSQUID

BioSQUID ist eine Bibliothek von C Code-Funktionen zu Sequenz-Analyse. Es enthält auch eine Reihe von kleinen Hilfswerkzeugen um Sequenzdateien zu konvertieren, Statistiken anzuzeigen, diese zu manipulieren und andere Funktionen auf sie anzuwenden.

BLAST2

Das berühmte Sequence-Alignments-Programm. Dies ist die offizielle NCBI-Version #2. Das blastall-Kommando ermöglicht Ihnen, dem Programm eine Nukleotid- oder Proteinsequenz zu übergeben. Diese wird mit Datenbanken verglichen und eine Zusammenfassung der Übereinstimmungen wird dem Benutzer zurückgegeben.

Boxshade

Boxshade liest als Eingabe ein Sequenz-Alignment (z.B. von ClustalW) und gibt Dateien aus, die in Textverarbeitungssoftware übernommen werden können (TeX über xfig, Word und OpenOffice über RTF). Das PostScript-Format wird ebenfalls unterstützt.

ClustalW

Dieses interaktive Konsolenprogramm ermöglicht das gleichzeitige Alignment von vielen Nukleotid- oder Aminosäuresequenzen. Es erkennt, welches Format benutzt wird und ob die Sequenzen Nukleinsäuren (DNS/RNS) oder Aminosäuren (Eiweiße) sind. Es gibt Alignments in verschiedenen Formaten aus, z.B. im PHYLIP-Format.

Dialign

DIALIGN2 ist ein Befehlszeilen-Werkzeug, um mehrere Alignments von Eiweiß- oder DNS-Sequenzen zu berechnen. Es konstruiert Alignments aus Gap-freien Paaren ähnlicher Segmente der Sequenzen. Dieses Punktesystem für Alignments ist der grundlegende Unterschied zwischen DIALIGN und anderen globalen oder lokalen Alignment-Methoden. Beachten Sie, daß DIALIGN keinerlei Gap-Penalty anwendet.

e-PCR

Elektronische PCR, die eine DNS-Sequenz auf das Vorhandensein von Sequenz-markierten Sites überprüft. e-PCR sucht nach STSs in DNS-Sequenzen, indem es nach Subsequenzen sucht, die den PCR-Primern gut entsprechen und die richtige Reihenfolge, Orientierung und Abstände aufweisen, so daß sie wahrscheinlich die Amplifikation eines PCR-Produkts mit dem korrekten Molekulargewicht primen (Schuler, Genome Research 7:541-50, 1997).

fastDNAml

fastDNAml ist abgeleitet von Joseph Felsensteins DNAML Version 3.3 (Teil seines Pakets PHYLIP). Bevor Sie fastDNAml verwenden, sollten Sie die Dokumentation für DNAML heranziehen. fastDNAml ist der Versuch, das gleiche Problem wie DNAML effektiver zu lösen, damit größere Bäume und/oder bootstrap-Replikate behandelt werden können. Das geschieht in der Regel auch recht schnell. Vieles von fastDNAml ist ein Umkodieren des Programms PHYLIP DNAML Version 3.3 von Pascal zu C.

Fastlink

Fastlink ist sehr viel schneller als das ursprüngliche Linkage, implementiert jedoch nicht alle Programme.

Garlic

Garlic wurde zur Untersuchung von Membraneiweißen geschrieben. Es kann dazu benutzt werden, andere Eiweiße sowie geometrische Objekte darzustellen. Diese Version von garlic erkennt das PDB-Format in der Version 2.1. Garlic kann auch dazu benutzt werden, Eiweißsequenzen zu analysieren.

Glimmer

Diese Software wurde vom TIGR-Institut entwickelt und erkennt kodierende Sequenzen in Bakterien und Archaebakterien. Glimmer ist ein System zum Auffinden von Genen in mikrobieller DNS, speziell den Genomen von Bakterien und Archaebakterien. Glimmer Markov-Modelle (IMMs), um kodierende Regionen zu identifizieren und von nicht-kodierender DNS zu unterscheiden.

GROMACS

GROMACS ist ein vielseitiges Paket zur Darstellung molekularer Dynamik, d.h. die Simulation der Newtonschen Gleichungen für Systeme mit mehreren Hundert bis hin zu Millionen Partikeln. Es ist hauptsächlich für biochemische Moleküle wie Proteine und Lipide entworfen, die viele komplizierte Bindungsinteraktionen besitzen. Da GROMACS aber extrem schnell bei der Berechnung von Interaktionen ist, die nicht durch Bindungen bestimmt werden (die aber üblicherweise in Simulationen vorherrschen), benutzen viele Arbeitsgruppen GROMACS auch für die Forschung an nicht-biologischen Systemen, z.B. Polymeren.

HMMER

HMMER ist eine Implementation von Profile-Hidden-Markov-Modell-Methoden für empfindliche Durchsuchungen von biologischen Sequenz-Datenbanken unter Verwendung von mehrfachen Sequenz-Alignments als Anfragen. Wird eine mehrfache Sequenz-Alignment als Eingabe übergeben, baut HMMER ein statistisches Modell namens hidden Markov model auf, das dann als Anfrage für eine Sequenz-Datenbank verwendet werden kann, um zusätzliche Homologe des Sequenz-Familie zu finden (und/oder zu alignen).

Kalign

Kalign ist ein Kommandozeilenwerkzeug, um mehrfache Alignments von biologischen Sequenzen durchzuführen. Es wenden den Wu-Manber Zeichenketten-Abgleich-Algorithmus an, um sowohl die Genauigkeit als auch die Geschwindigkeit des Alignment zu verbessern. Es verwendet einen globalen, fortschreitenden Alignment-Ansatz, bereichert durch den Einsatz eines annähernden Zeichenketten-Abgleich-Algorithmus um Sequenz-Abstände zu berechnen und indem lokale Übereinstimmungen in ein ansonsten globales Alignment eingebaut werden. Bei Vergleichen, die durch seine Autoren durchgeführt wurden, war Kalign rund zehn mal schneller als ClustalW und, abhängig von der Größe des Alignments, bis zu 50 mal schneller als beliebte iterative Methoden.

Loki

Führt eine Markov chain Monte Carlo multipoint linkage-Analyse für große, komplexe Stammbäume durch. Das aktuelle Paket unterstützt nur Analysen von quantitativen Merkmalen, allerdings wird diese Beschränkung in späteren Versionen aufgehoben werden. Die Joint estimation der QTL-Nummer, Position und Effekten benutzt Reversible Jump MCMC. Es ist auch möglich, eine affected only IBD sharing-Analyse durchzuführen.

MOLPHY

ProtML ist ein Hauptprogramm innerhalb von MOLPHY, um evolutionäre Bäume von PROTein-(Aminosäure-)sequenzen abzuleiten, indem es die Maximum-Likelihood-Methode benutzt. Weitere Programme dieses Paketes sind: NucML (Maximum-Likelihood-Ableitung der Stammbäume von Nukleinsäuren), ProtST (Grundlegende Statistiken von Eiweißsequenzen), NucST (Grundlegende Statistiken von Nukleinsäuresequenzen), NJdist (Neighbor Joining-Stammbäume aus der Distance-Matrix) und andere.

Muscle

MUSCLE ist ein Programm für das Berechnen von mehrfachen Alignments bei Eiweißsequenzen. MUSCLE steht für multiple sequence comparison by log-expectation. In den Tests der Autoren erreichte MUSCLE die höchsten Punktzahlen aller getesteten Programme bei mehreren Benchmarks zur Genauigkeit der Alignments. Weiterhin ist es eines der schnellsten Programme, die derzeit existieren.

NJplot

NJplot kann beliebige Binärbäume zeichnen, die im phylogenetischen Standard-Baumformat (das Phylip-Paket benutzt z.B. dieses Format) niedergelegt sind. NJplot ist besonders nützlich, um wurzellose Bäume aus parsimony einzupflanzen, sowie für Distanz- und Maximum-Likelihood-Umformungen.

PerlPrimer

PerlPrimer ist eine in Perl geschriebene freie grafische Open-Source-Applikation, die Primer für die Standard-PCR, Bisulphit-PCR, Echtzeit-PCR (QPCR) und Sequenzierung entwirft. Das Ziel ist, den Prozeß des Primerentwurfs zu automatisieren und zu vereinfachen. Es kommuniziert gut mit dem Ensembl-Projekt, falls Sie online sind, um weitere Einsichten in die Gen-Struktur zu ermöglichen.

PHYLIP

PHYLIP (PHYLogeny Inference Package) ist ein Paket von Programmen für Stammbaumableitungen (Evolutionsbäume) von Sequenzen. Methoden, die in diesem Paket verfügbar sind, beinhalten parsimony, distance matrix und likelihood-Methoden, inklusive bootstrapping und Übereinstimmungsbäumen. Datenarten, die benutzt werden können, sind molekulare Sequenzen, Genhäufigkeiten, Restriktionsstellen, Distanzmatrizen und 0/1-diskrete Zeichen.

POA

POA ist Partial Order Alignment, ein schnelles Programm für mehrfaches Sequenz-Alignment in der Bioinformatik. Seine Vorzüge sind Geschwindigkeit, Skalierbarkeit, Empfindlichkeit und die überragende Fähigkeit, Verzweigung / Indels im Alignment handzuhaben.

Primer3

Primer3 wählt Primer für Polymerase-Kettenreaktionen unter Berücksichtigung der Kriterien Schmelztemperatur, Größe und GC-Gehalt der Oligonukleotide sowie Möglichkeiten von Primer-Dimeren; Größe des PCR-Produkts und Beschränkungen der Positionierung innerhalb der Ausgangssequenz. Alle diese Kriterien können vom Benutzer als Bedingungen spezifiziert werden, und einige können als Term in einer Zielfunktion angegeben werden, die ein optimales Primerpaar charakterisiert.

ProbCons

Werkzeug, um mehrfache Alignments von Protein-Sequenzen zu erstellen. Unter Verwendung von einer Kombination von Wahrscheinlichkeits-Modellierung und Konsistenz-basierenden Alignment-Techniken hat PROBCONS heute die höchste Genauigkeit aller Alignmethoden erreicht. In der BAliBASE-Alignment-Benchmark-Datenbank zeigen die von PROBCONS erstellten Alignments statistisch signifikante Verbesserungen gegenüber aktuellen Programmen auf, sie enthalten im Schnitt 7% mehr an korrekt ausgerichteten Spalten als T-Coffee, 11% mehr an korrekt ausgerichteten Spalten als CLUSTAL W und 14% mehr an korrekt ausgerichteten Spalten als DIALIGN.

PyMOL

PyMOL ist ein molekulares Grafiksystem mit einem eingebetteten Python-Interpreter. Es wurde zur Echtzeit-Visualisierung und schnellen Erzeugung von qualitativ hochwertigen Molekular-Bildern und -Animationen entwickelt und ist vollständig erweiterbar und mittels der Python-Lizenz für jeden frei. Obwohl es auf diesem Gebiet ein Newcomer ist, kann PyMOL bereits benutzt werden, um erstaunliche Bilder und Animationen mit noch nicht dagewesener Leichtigkeit zu erzeugen. Es kann außerdem viele andere wertvolle Aufgaben (wie das Editieren von PDB-Dateien) übernehmen, um Sie bei Ihrer Forschung zu unterstützen.

R/qtl

R/qtl ist eine erweiterbare, interaktive Umgebung, um quantitative Merkmalsloki (QTLs) in experimentellen Kreuzungen abzubilden. Es ist als Zusatzpaket für die frei verfügbare und weit verbreitete statistische Sprache/Software R implementiert. Der Benutzer profitiert von der nahtlosen Integration der QTL-Abbildungssoftware in ein allgemeines statistisches Analyseprogramm.

Die aktuelle Version von R/qtl enthält Hilfen zum Abschätzen von genetischen Karten, Identifizieren von genotypischen Fehlern und führt Einzel-QTL-Genomscans sowie Zwei-QTL-, zweidimensionale Genomscans mittels Intervallabbildung (mit EM-Algorithmus), Haley-Knott-Regression und vielfacher Unterstellung durch. Dies alles kann in der Gegenwart von Kovarianten (wie Geschlecht, Alter oder Behandlung) durchgeführt werden. Die fit of higher-order-QTL-Modelle, mit ausgefeilten Techniken zum Vergleich und der Suche von Modellen, werden bald aufgenommen.

RasMol

RasMol ist ein Grafikprogramm für die Visualisierung von Proteinen, Nukleinsäuren und kleinen Molekülen. Das Programm ist zur Anzeige, Schulung/Lehre und zur Erzeugung von qualitativ hochwertigen Bildern gedacht. Momentan unterstützte Eingabeformate sind Brookhaven Protein Databank (PDB), Tripos' Alchemy, Sybyl Mol2, Molecular Design Limited's (MDL), Minnesota Supercomputer Center's (MSC) XMol XYZ und CHARMm. Das geladene Molekül kann als Drahtmodell, Zylinderverbindung, alpha-carbon trace, leerraumfüllende Kugeln, makromolekulare Bänder (entweder sanft schattierte feste Bänder oder parallele Stränge), Wasserstoffbindung und Punktoberfläche angezeigt werden.

Readseq

Liest und schreibt Zellkern-/Eiweißsequenzen in verschiedenen Formaten. Dateien können mehrere Sequenzen enthalten. Readseq ist besonders nützlich, weil es automatisch viele Sequenzformate erkennt und zwischen ihnen konvertiert.

SeaView

Dies ist ein grafischer Editor für den Umgang mit Biosequenzen. SeaView ist in der Lage, verschiedene Alignment-Formate zu lesen (MSF, CLUSTAL, FASTA, PHYLIP, MASE, NEXUS). Es ermöglicht einem, das Alignment manuell zu bearbeiten und außerdem ClustalW auszuführen, um das Alignment örtlich zu verbessern.

SIBsim4

Das SIB (Swiss Institute of Bioinformatics) sim4-Projekt basiert auf sim4, einem Programm, daß entwickelt wurde, um die Expression einer DNS-Sequenz mit einer genomischen Sequenz zu alignen und dabei Introns zu erlauben. Sim4 wurde von Liliana Florea geschrieben, während sie im Webb Millers Labor in der Pennsylvania State University arbeitete. SIBsim4 ist eine recht umfangreiche Neuerstellung des ursprünglichen Codes mit den folgenden Zielen: Geschwindigkeitsverbesserung; Einsetzbarkeit auf auf großen (Größenordnung von Chromosomen) DNS-Sequenzen; detailliertere Ausgabe über Spleiß-Typen; detailliertere Ausgabe über Poly(A)-Schwänze.

Sigma

Sigma (Simple greedy multiple alignment) ist ein Alignment-Programm mit einem neuen Algorithmus und Beurteilungsschema, daß speziell für nichtkodierende DNS-Sequenzen entwickelt wurde. Sigma verwendet eine Strategie des Suchens nach dem bestmöglichen Gap-freien lokalen Alignment (eine Strategie, die früher von DiAlign verwendet wurde), bei der in jedem Schritt das best-mögliche Alignment erstellt wird, daß mit existierenden Alignments konsistent ist, und beurteilt die Signifikanz des Alignments basierend auf der Länge des alignt Fragments und des Hintergrundmodells, das bereitgestellt oder aus einer externen Datei von intergenetischer DNS geschätzt werden kann.

T-Coffee

T-Coffee ist ein Programm für das Alignment mehrerer Sequenzen. Aus einem vorgegebenen Satz von Sequenzen (Proteine oder DNS) erzeugt T-Coffee Alignments. Version 2.00 und größer kann Sequenzen und Strukturen mischen.

TeXtopo

TeXtopo ist ein LaTeX2e Makropaket, das zwei neue TeX-Umgebungen bereitstellt: Die textopo-Umgebung wird zur Darstellung von Membranprotein-Topologiedaten aus PHD-Berechnungen, SwissProt-Datenbankeinträgen oder manuell eingegebenen Sequenz- und Topologiedaten verwendet Die helical wheel-Umgebung zeichnet transmembranäre Domänen als Aufblick auf die Zellmembran entweder vom Extra- oder vom Intrazellulärraum aus gesehen.

TREE-PUZZLE

TREE-PUZZLE (früher PUZZLE) ist ein interaktives textorientiertes Programm, das einen schnellen Tree-Search-Algorithmus, so genanntes Quartet Puzzling, implementiert. Es erlaubt die Analyse großer Datenmengen und trifft automatisch Entscheidungen für die Anordnung der jeweiligen Verzweigungen. Weiterhin berechnet TREE-PUZZLE mittels der paarweisen Maximum-Likelihood-Methode Abstände sowie Längen von Verzweigungen für vom Nutzer definierte Cluster. Die Längen der Verzweigungen können auch unter der Clock-Assumption berechnet werden. Außerdem bietet TREE-PUZZLE eine neue Methode, das Likelihood Mapping, um die Anordnung einer hypothetischen internen Verzweigung zu untersuchen ohne den gesamten Cluster zu berechnen, und um den phylogenetischen Zusammenhang eines Sequenz-Alignments anzuzeigen.

Treetool

Treetool ist ein interaktives Werkzeug für die Darstellung, Bearbeitung und den Ausdruck von Stammbäumen. Der Baum wird in verschiedenen Formaten grafisch auf dem Bildschirm angezeigt und der Benutzer ist in der Lage, das Format, die Struktur oder die Merkmale des Baumes zu ändern. Bäume können angesehen, verglichen oder für den Ausdruck formatiert werden. Sie können von kleineren Bäumen erstellt werden usw.

TreeView X

TreeView X ist ein Programm zur Anzeige von Stammbäumen auf Linux- und Unix-Plattformen. Es kann Baumdateien im NEXUS- und Newick-Format lesen und anzeigen (so wie die, die von PAUP*, ClustalX, TREE-PUZZLE und anderen Programmen ausgegeben werden).

6.2. Medizinische Bildverarbeitung

CTN

Die Central Test Node-Software (CTN) ist eine DICOM-Implementation, die für die Jahresversammlung der RSNA (Radiological Society of North America, Nordamerikanische Gesellschaft für Radiologie) entwickelt wurde, um kooperative Demonstrationen von Herstellern bildgebender Geräte zu fördern. Das Ziel war, eine zentralisierte Implementation zur Verfügung zu stellen, die die Teilnahme der Hersteller auf der Basis des sich entwickelnden DICOM-Standards vereinfachte.

CTSim

CTSim enthält einen interaktiven Simulator für berechnete Tomografie. Berechnete Tomografie ist die Technik, das Innere eines Objektes durch Messung der Röntgenstrahlung-Absorption durch das Objekt zu schätzen. Es enthält sowohl Kommandozeilenwerkzeuge als auch eine grafische Benutzeroberfläche. CTSim besitzt sehr lehrreiche Modi zum Betrachten der Datensammel-Simulation als auch für die Rekonstruktion.

DCMTK - DICOM-Toolkit

DCMTK ist eine Sammlung von Bibliotheken und Anwendungen, die zusammen große Teile des DICOM-Standards für medizinische Bildkommunikation implementieren. DCMTK enthält Anwendungen zum Untersuchen, Erzeugen und Konvertieren von DICOM-Bilddateien, zum Bearbeiten von Speichermedien, zum Versenden und Empfangen von DICOM-Bildern in einem Netzwerk sowie Speicherung von Demonstrationsbildern und Arbeitslisten-Servern. DCMTK ist in einem Gemisch aus ANSI C und C++ implementiert.

Niftilib

Niftilib ist ein Satz an I/O-Bibliotheken zum Lesen und Schreiben von Dateien im NIfTI-1 Datenformat. NIfTI-1 ist ein binäres Dateiformat zum Speichern von medizinischen Bilddaten, z.B. Kernspinresonanztomogrammen (MRI - magnetic resonance image) und funktionalen Kernspinresonanztomogrammen (fMRI) des Gehirns.

(X)MedCon

Der Projektname steht für Medical Image Conversion (Umwandlung medizinischer Bilder). Es stellt ein flexibles Kommandozeilen-Werkzeug (für Stapel-Umwandlungen) und eine hübsche grafische Oberfläche mittels der Gtk+-Bibliothek zur Verfügung. Unterstützte Formate sind: Acr/Nema 2.0, Analyze (SPM), Concorde, DICOM 3.0 (inkl. Siemens mosaic-Format), Ecat/Matrix 6.4, InterFile3.3, Gif87a/89a und binäre Daten. Die Bibliothek (libmdc) kann von anderen Programmen (siehe z.B. AMIDE) zum Import und Export dieser Formate verwendet und für neue Formate erweitert werden.