Espectroscopio de software – cuenta mercantil bitcoin spctools

El objetivo de la proteómica es la identificación sistemática y la cuantificación de todas las proteínas en un sistema biológico. En uno de los flujos de trabajo más frecuentemente practicados, comúnmente conocido como proteómica de escopeta, una muestra de proteína de interés primero se digiere con una enzima proteolítica (siendo la tripsina la más común) para producir péptidos que son susceptibles de análisis de LC-MS / MS. Los péptidos en la mezcla resultante se resuelven por cromatografía, se ionizan mediante técnicas tales como ionización por electrospray (ESI) o ionización por desorción láser asistida por matriz (MALDI) antes de analizarse mediante un espectrómetro de masas. Una fracción del iones peptídicos se aíslan selectivamente mediante el espectrómetro de masas y se someten a disociación inducida por colisión (CID), en la que los iones peptídicos se bombardean con átomos de gas noble para inducir la fragmentación. (Otros tipos de técnicas de fragmentación también están madurando rápidamente). Los iones fragmentos se detectan y notifican mediante el espectrómetro de masas como espectros de masa en tándem (MS / MS). Debido a que los iones peptídicos tienden a fragmentarse principalmente a lo largo de la cadena principal del péptido de una manera algo predecible, los espectros MS / MS contienen información que puede usarse para deducir la secuencia peptídica.

Tradicionalmente, la inferencia de la secuencia peptídica a partir de sus espectros de masa en tándem característicos se realiza por búsqueda de secuencia (base de datos). En la búsqueda de secuencias, se usa una base de datos de proteína diana (o ADN traducido) como referencia para generar todas las posibles secuencias peptídicas putativas mediante digestión in silico. Los motores de búsqueda luego usan varias reglas para predecir el patrón de fragmentación teórico de cada uno de estos péptidos putativos, y comparan los espectros de MS / MS observados experimentalmente con estos espectros teóricos uno a uno. Presumiblemente, se realiza una identificación positiva si el espectro experimental es suficientemente similar a uno de los espectros teóricos. Varias herramientas computacionales populares desarrolladas para este propósito han surgido a lo largo de los años, cada una empleando diferentes algoritmos y heurísticas para lograr un equilibrio aceptable de sensibilidad y precisión. Desafortunadamente, la búsqueda de secuencia tradicional es un ejercicio desafiante, propenso a errores y computacionalmente costoso. A pesar de la enorme mejora en el hardware y el software de la computadora durante la última década, este paso a menudo sigue siendo el cuello de botella de cualquier experimento de proteómica dado. El requisito de recursos computacionales también es sustancial, lo que limita el uso de esta poderosa técnica solo a aquellos grupos de investigación que pueden permitirse la costosa infraestructura computacional.

La búsqueda espectral es un enfoque alternativo que promete abordar algunas de las deficiencias de la búsqueda de secuencias. En la búsqueda espectral, se compila meticulosamente una biblioteca espectral a partir de una gran colección de espectros de MS / MS peptídicos previamente observados e identificados. El espectro desconocido puede entonces identificarse comparándolo con todos los candidatos en la biblioteca espectral para la mejor coincidencia. Este enfoque se ha empleado comúnmente para el análisis de espectrometría de masas de moléculas pequeñas con gran éxito, pero solo ha sido posible recientemente para la proteómica. La principal dificultad de generar suficientes espectros experimentales de alta calidad para su compilación en bibliotecas espectrales ha sido superada por la reciente explosión de datos de proteómica y la disponibilidad de repositorios de datos públicos. Varios intentos de crear y buscando espectral las bibliotecas en el contexto de la proteómica se han publicado durante el año pasado, lo que demuestra la tremenda mejora en la velocidad de búsqueda y el gran potencial de este método para complementar, si no reemplazar, la búsqueda de secuencias en muchas aplicaciones de proteómica.

La búsqueda espectral se beneficia de un espacio de búsqueda mucho más reducido en comparación con la búsqueda por secuencia. En la búsqueda espectral, solo los iones peptídicos que se observan e identifican en experimentos previos serán incluidos en bibliotecas espectrales y considerados como candidatos, mientras que en la búsqueda de secuencias, todas las secuencias peptídicas putativas – más todas las permutaciones de sitios de modificación postraduccional, si se especifican – – en una base de datos de proteínas se consideran. La mayoría de estos supuestos iones peptídicos considerados en la búsqueda de secuencias nunca se observan en la práctica por una variedad de razones. Con los parámetros de búsqueda típicos, el espacio de búsqueda de la búsqueda espectral puede ser varios órdenes de magnitud menor. Por lo tanto, no es sorprendente que la búsqueda espectral también pueda ser de varios órdenes de magnitud más rápida. SpectraST puede alcanzar una velocidad máxima de 0.001 a 0.01 segundos por espectro de consulta (contra una biblioteca de aproximadamente 50,000 entradas) en una computadora personal moderna. Por el contrario, SEQUEST, uno de los motores de búsqueda de secuencias más populares, necesita aproximadamente de 5 a 20 segundos por espectro de consulta (en comparación con una base de datos IPI humana).

La búsqueda espectral compara los espectros experimentales con los espectros experimentales; búsqueda de secuencia se compara espectros experimentales a los espectros teóricos. En general, los espectros teóricos considerados en la búsqueda de secuencias son muy simplistas (p. Ej., Solo incluyen iones de tipo b e y, a una intensidad fija), y no se parecen a los espectros experimentales que se supone que coinciden. Por otro lado, armado con espectros experimentales previamente observados compilados en bibliotecas espectrales, la búsqueda espectral puede aprovechar al máximo todas las características espectrales, incluidas las intensidades máximas reales, pérdidas neutrales de fragmentos y varios fragmentos poco comunes o incluso desconocidos, para determinar la mejor coincidencia . La puntuación de similitud de la búsqueda espectral es, por lo tanto, más precisa y, en general, proporcionará una mejor discriminación entre las coincidencias buenas y malas. Esto generalmente da como resultado estadísticas mucho mejores (por ejemplo, sensibilidad, tasas de descubrimiento falsas) para los resultados de búsqueda, en comparación con búsqueda de secuencia.

Si se suministran archivos de estas extensiones, SpectraST simplemente los convierte bibliotecas espectrales en una forma adecuada para búsquedas SpectraST (formatos .splib). (Sin embargo, tenga en cuenta que no existe ningún estudio sobre qué tan bien funciona SpectraST con las bibliotecas X! Hunter y BiblioSpec). Por ejemplo, para importar la biblioteca de consenso de levadura NIST y llamar a la biblioteca resultante bar.splib y ponerla en el directorio / dir / , el comando es:

Cuando termina, produce 5 archivos en el directorio / dir /. El archivo bar.splib es la biblioteca misma; está en un formato binario (legible por máquina). El archivo bar.sptxt es una versión de texto (humanamente legible) de bar.splib. Este archivo .sptxt no sirve para SpectraST; se puede eliminar después de la inspección manual. Los archivos bar.spidx y bar.pepidx son índices sobre el valor precursor m / z y el péptido, respectivamente. Mantenga los índices y el archivo .splib en el mismo directorio para que SpectraST funcione correctamente. Por último, también se crea un archivo spectrast.log para documentar el comando ejecutado. Se imprime cierta información útil sobre la biblioteca al principio de bar.sptxt y bar.pepidx.

Estos comandos crearán las bibliotecas sin formato rawA.splib, rawB.splib y rawC.splib. Las identificaciones de múltiples archivos .pepXML del mismo conjunto de datos se importan con el mismo identificador de conjunto de datos. La misma consulta con identificaciones de múltiples motores de búsqueda se combinará de forma inteligente. El umbral de probabilidad por encima del cual se importan las identificaciones se puede especificar con la opción -cP, que por defecto es 0,9. Esto no fusionará las réplicas de la misma identificación de iones peptídicos en un espectro de consenso. Recuerde que los archivos .mzXML deben estar en los mismos directorios que sus correspondientes archivos .pepXML.

Esto ejecutará los espectros de consenso a través de SpectraSTfiltros de calidad. Con la configuración predeterminada, los espectros que fallen uno o ambos de los primeros 2 filtros serán eliminados, y los espectros que fallan en cualquiera de los otros filtros serán marcados. Se pueden establecer diferentes niveles de calidad con las opciones -cL y -cl. Se recomienda que una biblioteca espectral consensuada esté sujeta a algún control de calidad antes de usarla en la búsqueda espectral; el nivel de calidad óptimo refleja el compromiso deseado del usuario entre la exhaustividad de la biblioteca y la calidad de la biblioteca. Esto es para minimizar los espectros mal identificados y de baja calidad en la biblioteca. Estos espectros cuestionables pueden propagar errores de la búsqueda de secuencias, reducir el poder de discriminación del motor de búsqueda espectral e inducir falsos positivos y falsos negativos.

La monitorización de reacción seleccionada (SRM, también conocida como Monitorización de Reacción Múltiple, MRM) es un modo de adquisición disponible en algunos espectrómetros de masas (principalmente instrumentos de cuadrupolo triple) que ha ganado popularidad como técnica de cuantificación específica. Requiere como entrada una lista de “transiciones” para ser monitoreadas durante el transcurso del experimento. Cada transición consta de dos números, Q1 (el precursor m / z) y Q3 (el ion de fragmento m / z) y debe seleccionarse de antemano basándose en el conocimiento del péptido a cuantificar. Una de las estrategias más efectivas para seleccionar las transiciones apropiadas es confiar en los espectros de MS2 previamente adquiridos de los péptidos diana almacenados en bibliotecas espectrales.

Un completamente funcional software herramienta para el diseño de experimentos MRM, MaRiMba (Sherwood et al., (2009) Journal of Proteome Research 8, 4396-4405), que esencialmente envuelve este algoritmo de selección de transición de SpectraST así como implementa algunas funcionalidades circundantes, está disponible libremente como parte del TPP y accesible a través de la interfaz web de Petunia.

A partir de la versión 4.0, SpectraST puede generar espectros semiempíricos a partir de espectros reales de identificaciones estrechamente relacionadas, simplemente desplazando los picos en el eje m / z cuando corresponda. Esto es útil cuando se usan espectros de un estado de modificación para construir la biblioteca, pero se desea emparejar espectros de la misma secuencia pero otro estado de modificación en la búsqueda espectral.

Para hacerlo, el usuario debe activar la acción de compilación de generación de espectro semiempírico mediante la opción -cAM, y especificar qué modificaciones desea la opción -cx. El en este último es una cadena de tokens de modificación permitidos (sin espacio entre ellos). Un token de modificación comienza con un aminoácido de una letra (de la A a la Z, más n oc para el término), seguido de [] si no es la forma no modificada.

creará una biblioteca foo_metox.splib que contiene los mismos iones peptídicos que foo.splib, pero con todas las permutaciones posibles de metionina normal y oxidada. Esto se conoce comúnmente como modificación variable. Tenga en cuenta que la cadena ‘MM [147]’ significa que tanto M (metionina normal) como M [147] (metionina oxidada) se permiten cuando M está presente en una secuencia.

Tenga en cuenta que aunque los tokens de modificación, como M [147], contienen solo valores enteros (de los aminoácidos modificados) como una etiqueta, en los cálculos SpectraST usará la masa precisa correspondiente almacenada para ese tipo de modificación particular indicado por el token. Por lo tanto, para las modificaciones actualmente no reconocidas por SpectraST, el usuario debe definirlas (junto con la masa precisa) en un archivo de texto usando la opción -M.

banner