Mi código público

descripción de mis paquetes originales de Perl

por Alejandro Ochoa García

La unión de código a través de las distribuciones de DomStratStats, dPUC, y RandProt más recientes.

Imagen miniatura
VIIIA

es-mx en-us - - Mándame un correo

Resumen

Este documento sumariza mi código público más reciente que es parte de tres proyectos relacionados, DomStratStats 1.04, dPUC 2.06, y RandProt 1.01. Muchos paquetes están compartidos, así que aquí los describo de una vez para todos mis proyectos. Vease la página de cada proyecto para bajar el código, notas de la versión, e información adicional.

Todo mi código está publicado bajo la GNU GPLv3 (Licencia Pública General de GNU, versión 3).

Corriendo guiones de directorios arbitrarios

Mire el ejemplo siguiente. Esta manera de especificar la localización de mis paquetes se ha verificado funcionar con todos mis guiones.

# corre el guión desde el directorio que lo contiene 
cd /myCode/ 
perl -w myScript.pl <ARGS>... 

# corre el guión desde otros directorios 
cd /otherDir/ 
perl -I/myCode/ -w /myCode/myScript.pl <ARGS>...

Descripción de los paquetes originales de Perl

Ya que mi código fuente no viene documentado, aquí está una descripción breve de lo que hace cada paquete.

Archivo Versión más reciente Descripción Proyectos que lo comparten
FileGz.pm 1.01 Maneja archivos normales y comprimidos transparentemente. DomStratStats, dPUC, RandProt
ParseFasta.pm 1.00 Herramientas ligeras para manejar archivos FASTA. DomStratStats, RandProt
ParsePfam.pm 1.01 Lee Pfam-A.hmm.dat y otros archivos específicos de Pfam. DomStratStats, dPUC
Domains.pm 1.00 Procesa dominios, particularmente superposiciones. DomStratStats, dPUC
Hmmer3ScanTab.pm 1.03 Corre e interpreta los archivos de salida de hmmscan hacia mi estructura de dominios, una proteína a la vez para reducir el uso de memoria, y también produce archivos de salida (con la intención de filtrar dominios sólamente) y añade columnas especiales. DomStratStats, dPUC
Qvalue.pm 1.01 Herramienta de uso general para calcular y analizar valores \(p\) para obtener valores \(q\), particularmente para valores \(p\) con censura. DomStratStats
QvalueLocal.pm 1.02 Herramienta de uso general para calcular y analizar valores \(p\) para obtener el lFDR (siglas en inglés de la Tasa de Falso Descubrimiento local), particularmente para valores \(p\) con censura. DomStratStats
DomStratStats.pm 1.03 Aplica los valores \(q\) y lFDR para las predicciones de dominio de HMMER3. DomStratStats
ProtKmer.pm 1.00 Funciones para normalizar las secuencias de proteína, y para contar \(k\)-meros eficientemente. RandProt
ProtMarkov.pm 1.01 Funciones que generan las secuencias aleatorias a partir de los datos de \(k\)-meros (y longitudes de proteínas). La parte más desafiante por desarrollar fue sacar el \(k\)-mero inicial de una secuencia, lo cual implica sacar muestras de una distribución categórica extremadamente grande con parámetros no uniformes. Codifiqué un método basado en la busqueda binaria que calcula cada muestra en \(O(\log(m))\), donde \(m \approx 20^k\) es el número de categorías, pero recientemente me he enterado de métodos más rápidos, los cuales puede que implemente en el futuro. De cualquier manera, esto es mucho más rápido que una implementación ingenua. RandProt
Dpuc.pm 2.06 El paquete principal de dPUC que conecta las diferentes estrategias para predecir dominios usando las puntuaciones de contexto de dPUC. dPUC
DpucPosElim.pm 2.00 Porción del código en C que resuelve la parte más intensa numéricamente de la "eliminación positiva" de dPUC. dPUC
DpucLpSolve.pm 1.01 Le dice a Perl donde encontrar la biblioteca de C de lpsolve55, construye un objeto "lp" a partir de los datos de Perl para resolver con lp_solve, y regresa el resultado a Perl. dPUC
DpucNet.pm 2.02 Extrae una red dirigida de conteos de pares de familias de dominio observadas en un archivo de Pfam-A.full. dPUC
DpucNetScores.pm 1.01 Convierte a la red de conteos de contexto de dPUC en una red de puntuaciones de bit para la predicción de dominios. dPUC
DpucOvsCompact.pm 1.00 Compacta las deficiones de superposición de dominios, encontrando cliques, para hacer a lp_solve más eficiente. dPUC
NetCC.pm 1.00 Encuentra componentes conectados en una red. dPUC
EncodeIntPair.pm 1.00 Aplica pares de enteros no negativos a enteros sencillos, para los casos de pares ordenados y no ordenados. dPUC

Descripción de los guiones originales de Perl

Sólo un guión está compartido, pero listo todo para tenerlo completo y también para documentar las versiones.

Archivo Versión más reciente Descripción Proyectos que lo comparten
0runHmmscan.pl 1.01 Adquiera predicciones de dominios para sus secuencias de proteína. DomStratStats, dPUC
1noOvs.pl 1.02 Remueve los dominios superimpuestos ordenando por valor \(p\). DomStratStats
2domStratStats.pl 1.00 Calcule y añada los valores \(q\), lFDRs y FDR|lFDR para dominios. DomStratStats
3tieredStratQ.pl 1.00 Calcule y añada valores \(q\) para secuencias y dominios. DomStratStats
4allManyOrgs.pl 1.00 Obtenga las predicciones finales de dominios a partir de varios archivos de secuencias. DomStratStats
dpucNet.pl 1.01 Extrae de las predicciones de Pfam una red de conteos de contexto. dPUC
1dpuc2.pl 1.01 Produzca predicciones de dominios de dPUC a partir de datos sin procesar de hmmscan. dPUC
kMax.pl 1.01 Calcule una cota superior débil para \(k\) para análisis de \(k\)-mero. RandProt
kCov.pl 1.01 Calcule el porcentaje de \(k\)-meros observados en un proteoma. RandProt
randProt.pl 1.01 Cree secuencias de proteinas aleatorias con un modelo de Markov de alto orden. RandProt

Compatibilidad

Este código fue probado con Perl 5.18, 5.20, y 5.22 (pero debería funcionar con cualquier version ≥5). Este codigo debería functionar con cualquier Linux y MacOS, pero déjenme saber si no es el caso.

Quiere una version para Windows?

Este código no va a funcionar en máquinas de Windows porque usa el ejecutable gzip y también usa cadenas de Unix. Sin embargo, si instala el paquete PerlIO::gzip, o trabaja exclusivamente con archivos sin comprimir, entonces el código debería functionar (con algunos ajustes, contácteme para mayor información).

VIIIA

Historial