Inferencia biologica de red
Inferencia biologica de red.La inferencia de redes biológicas es el proceso de hacer inferencias y predicciones sobre las redes biológicas.
Redes biologicas
En un sentido topológico, una red es un conjunto de nodos y un conjunto de bordes dirigidos o no dirigidos entre los nodos. Existen muchos tipos de redes biológicas, incluyendo transcripcionales, de señalización y metabólicas. Se conocen pocas redes de este tipo en algo que se acerque a su estructura completa, incluso en las bacterias más simples . Aún se sabe menos sobre los parámetros que rigen el comportamiento de dichas redes a lo largo del tiempo, cómo interactúan las redes en diferentes niveles de una célula y cómo predecir la descripción completa del estado de una célula eucariota o un organismo bacteriano en un momento dado en el futuro.
La biología de sistemas , en este sentido, está todavía en su infancia.
Existe un gran interés en la medicina de red para el modelado de sistemas biológicos . Este artículo se centra en un requisito previo necesario para el modelado dinámico de una red: la inferencia de la topología , es decir, la predicción del "diagrama de cableado" de la red. Más específicamente, nos centramos aquí en la inferencia de la estructura de red biológica utilizando los conjuntos crecientes de datos de expresión de alto rendimiento para genes , proteínas y metabolitos .
En resumen, los métodos que utilizan datos de alto rendimiento para deducir las redes reguladoras se basan en la búsqueda de patrones de correlación parcial o probabilidades condicionales que indiquen la influencia causal. Tales patrones de correlaciones parciales encontrados en los datos de alto rendimiento, posiblemente combinados con otros datos complementarios sobre los genes o proteínas en las redes propuestas, o combinados con otra información sobre el organismo, forman la base sobre la cual funcionan tales algoritmos . Dichos algoritmos pueden ser útiles para inferir la topología de cualquier red en la que el cambio de estado de un nodo pueda afectar el estado de otros nodos.
Redes de regulación transcripcional
Los genes son los nodos y los bordes se dirigen. Un gen sirve como fuente de un borde regulador directo de un gen diana al producir una molécula de ARN o proteína que funciona como un activador transcripcional o inhibidor del gen diana. Si el gen es un activador, entonces es la fuente de una conexión reguladora positiva; Si es un inhibidor, entonces es la fuente de una conexión regulatoria negativa. Los algoritmos computacionales toman como datos de entrada primarios las mediciones de los niveles de expresión de ARNm de los genes considerados para su inclusión en la red, lo que arroja una estimación de la topología de la red . Dichos algoritmos generalmente se basan en supuestos de linealidad, independencia o normalidad, que deben verificarse caso por caso.La agrupación o alguna forma de clasificación estadística se emplea típicamente para realizar una organización inicial de los valores de expresión de ARNm de alto rendimiento derivados de experimentos de micromatrices, en particular para seleccionar conjuntos de genes como candidatos para nodos de red.
Entonces surge la pregunta: ¿cómo pueden conectarse los resultados de agrupación o clasificación a la biología subyacente? Tales resultados pueden ser útiles para la clasificación de patrones, por ejemplo, para clasificar subtipos de cáncer o para predecir respuestas diferenciales a un medicamento(farmacogenómica). Pero para comprender las relaciones entre los genes, es decir, para definir con mayor precisión la influencia de cada gen en los demás, el científico generalmente intenta reconstruir la red reguladora de la transcripción. Esto se puede hacer mediante la integración de datos en modelos dinámicos respaldados por literatura de antecedentes, o información en bases de datos públicas , combinada con los resultados del agrupamiento. El modelado se puede realizar mediante una red booleana , mediante ecuaciones diferenciales ordinarias o modelos de regresión lineal , por ejemplo , regresión de ángulo mínimo , mediante red bayesiana o en base a enfoques de la teoría de la información . Por ejemplo, se puede hacer mediante la aplicación de un algoritmo de inferencia basado en correlación, como se explicará más adelante, un enfoque que está teniendo un éxito mayor a medida que el tamaño de los conjuntos de microarrays disponibles sigue aumentando.&
La transducción de señales
Redes de transducción de señales (muy importantes en la biología del cáncer). Las proteínas son los nodos y los bordes dirigidos representan la interacción en la que la conformación bioquímica del niño se modifica por la acción del padre (por ejemplo, mediada por fosforilación , ubiquitilación, metilación, etc.). La entrada principal en el algoritmo de inferencia sería datos de un conjunto de experimentos que miden la activación / inactivación de proteínas (por ejemplo, fosforilación / desfosforilación) a través de un conjunto de proteínas. La inferencia para tales redes de señalización se complica por el hecho de que las concentraciones totales de proteínas de señalización fluctuarán con el tiempo debido a la regulación transcripcional y traduccional. Tal variación puede llevar a confusión estadística. En consecuencia, se deben aplicar técnicas estadísticas más sofisticadas para analizar dichos conjuntos de datos.
Metabolico
Redes de metabolitos .
Los metabolitos son los nodos y los bordes están dirigidos. La entrada primaria en un algoritmo sería datos de un conjunto de experimentos que miden los niveles de metabolitos.
Interacción proteína-proteína
Las redes de interacción proteína-proteína también están bajo un estudio muy activo. Sin embargo, la reconstrucción de estas redes no utiliza la inferencia basada en la correlación en el sentido discutido para las redes ya descritas (la interacción no implica necesariamente un cambio en el estado de la proteína), y la descripción de dicha reconstrucción de la red de interacción se deja para otros artículos.
Comentarios
Publicar un comentario