Ruta de aprendizaje

Resumen tecnico

Resumen tecnico PROTEONEXT

PROTEONEXT se plantea como una plataforma soberana de I+D para acelerar el descubrimiento y priorizacion de peptidos antimicrobianos frente a patogenos multirresistentes.

La promesa defendible no es crear un antibiotico clinico en pocos meses. La promesa defendible es crear una plataforma reproducible que reduzca el espacio de busqueda, priorice candidatos y cierre un primer bucle laboratorio-modelo sin mover dato sensible.

Rol natural de Syntax

Syntax deberia liderar la capa tecnologica:

  • Azure landing zone.
  • Microsoft Entra ID, RBAC, PIM y workload identities.
  • Red privada, Private Link, Azure Firewall y DNS privado.
  • Key Vault o Managed HSM.
  • Federated analytics y federated learning.
  • MLOps, model registry y trazabilidad.
  • Microsoft Purview para gobierno y linaje.
  • Fabric y Power BI para control de proyecto con datos agregados.
  • Defender for Cloud y Sentinel para seguridad.
  • Confidential computing y attestation cuando el riesgo lo justifique.

Rol natural de socios cientificos

Los socios cientificos y clinicos deberian aportar:

  • Microbiologia clinica.
  • Aislados bacterianos.
  • Antibiogramas, MIC y fenotipos de resistencia.
  • Genomica bacteriana cuando exista.
  • Ensayos MIC/MBC, hemolisis, citotoxicidad y estabilidad.
  • Criterio cientifico sobre patogenos, paneles y candidatos.

Regla de seguridad

El dato sensible permanece en origen. En el diseno federado viajan consultas, codigo, modelos, metricas, gradientes protegidos o artefactos autorizados.

Primer laboratorio didactico

La carpeta Desarrollo empieza con datos sinteticos y nodos simulados. Esto permite aprender y demostrar:

  • Que significa un antibiograma.
  • Que es MIC.
  • Como se agregan metricas AMR sin mover filas.
  • Como se entrena un modelo federado basico.
  • Como se puede puntuar un peptido de forma simplificada.
  • Donde encaja confidential computing en Azure.

Glosario

Glosario PROTEONEXT

Cientifico y AMR

Termino Explicacion corta
AMR Antimicrobial resistance. Resistencia de microorganismos a antimicrobianos.
One Health Enfoque que conecta salud humana, animal y ambiental.
AMP Antimicrobial peptide. Peptido con posible actividad antimicrobiana.
MIC Minimum inhibitory concentration. Concentracion minima que inhibe crecimiento bacteriano.
MBC Minimum bactericidal concentration. Concentracion minima bactericida.
AST Antimicrobial susceptibility testing. Prueba de sensibilidad antimicrobiana.
CRAB Carbapenem-resistant Acinetobacter baumannii.
CRE Carbapenem-resistant Enterobacterales.
CRPA Carbapenem-resistant Pseudomonas aeruginosa.
Hemolisis Ruptura de globulos rojos; senal de toxicidad para algunos peptidos.
Citotoxicidad Dano a celulas humanas o de mamifero.
Active learning El modelo elige que experimentos nuevos aportarian mas informacion.

Datos y federacion

Termino Explicacion corta
Nodo Hospital, laboratorio o entidad que conserva datos localmente.
Federated analytics Consultas distribuidas donde solo salen agregados.
Federated learning Entrenamiento distribuido donde cada nodo entrena localmente y comparte parametros.
Secure aggregation Tecnica para que el coordinador vea solo agregados protegidos.
DUA Data use agreement. Acuerdo de uso de datos.
DPIA/EIPD Evaluacion de impacto de proteccion de datos.

Microsoft/Azure

Termino Explicacion corta
Entra ID Identidad, acceso, grupos, RBAC, PIM y aplicaciones.
Private Link Acceso privado a servicios PaaS sin exponerlos publicamente.
Key Vault Gestion de secretos, claves y certificados.
Managed HSM HSM gestionado para claves con mayores requisitos.
Purview Gobierno de datos, catalogo, linaje, clasificacion y politicas.
Fabric Plataforma de analitica para lakehouse, pipelines, reporting y Power BI.
Sentinel SIEM/SOAR para monitorizacion y respuesta.
Confidential VM Maquina virtual con proteccion de memoria en uso.
Attestation Verificacion criptografica de que una carga corre en un entorno esperado.

Mapa de conceptos

Mapa de conceptos

Patogenos AMR y datos locales
        |
        v
Nodos hospitalarios simulados
        |
        | No salen filas
        v
Federated analytics
        |
        | Salen agregados
        v
Dashboard / Fabric / Power BI

Datos sinteticos + resultados experimentales futuros
        |
        v
Modelos locales por nodo
        |
        | Salen pesos o gradientes
        v
Federated learning
        |
        v
Modelo global
        |
        v
Scoring de candidatos AMP
        |
        v
Validacion wet lab por socios cientificos

Como leerlo desde Microsoft

  • La federacion define el patron de datos: no centralizar filas sensibles.
  • Entra ID define quien puede lanzar jobs y desde donde.
  • Key Vault/HSM protege secretos, claves y firma de trabajos.
  • Purview documenta que datos existen, quien los usa y con que linaje.
  • Fabric/Power BI muestra agregados, calidad, rondas FL y funnel AMP.
  • Confidential Computing protege computacion sensible y aporta attestation.

Que no resuelve este laboratorio

  • No valida un candidato terapeutico.
  • No reemplaza a microbiologos ni bioinformaticos.
  • No usa datos reales.
  • No decide arquitectura Azure final.
  • No revisa licencias de modelos como ESM, AlphaFold o RFdiffusion.