Ruta de aprendizaje
Nodos3
Aislados1160
Resultados AST4640

Tablas del contrato minimo

El objetivo no es copiar toda la historia clinica, sino construir el minimo dataset util para AMR federado.

patients Minimo demografico seudonimo: banda de edad, sexo y region simulada.
encounters Contexto del episodio hospitalario: mes, UCI, foco infeccioso y desenlace agregado.
specimens Muestras microbiologicas con tipo de muestra, codigo local y referencia terminologica simulada.
isolates Aislados bacterianos con grupo AMR, especie, mecanismo de resistencia y disponibilidad genomica.
ast_results Resultados de sensibilidad antimicrobiana con antibiotico, MIC, breakpoint e interpretacion S/I/R.
genomics Metadatos genomicos bacterianos opcionales: MLST, genes AMR y marcador plasmidico simulado.

Volumen por nodo

Cada nodo conserva sus tablas locales. La plataforma central solo necesita contratos y agregados autorizados.

Nodo Patients Encounters Specimens Isolates AST Genomics
nodo_madrid_norte 327 327 327 353 1412 165
nodo_barcelona_mar 433 433 433 459 1836 286
nodo_valencia_turia 315 315 315 348 1392 121

Calidad sintetica

OK

  • one_patient_per_encounter: OK
  • one_specimen_per_isolate: OK
  • four_ast_results_per_isolate: OK
  • no_direct_identifiers: OK

Privacidad

Sin pacientes reales, sin identificadores directos y sin fechas con granularidad inferior al mes.

README del modulo

08 Modelo de datos AMR mas realista

Este modulo evoluciona el CSV simple del inicio hacia un modelo AMR relacional y mas parecido a lo que un nodo hospitalario tendria que normalizar antes de participar en PROTEONEXT.

No usa datos reales. Todo es sintetico y pedagogico.

Problema que resuelve

En un hospital real, los datos no llegan como una tabla limpia. Suelen estar repartidos entre:

  • Sistemas clinicos.
  • LIS/microbiologia.
  • Antibiogramas y MIC.
  • Secuenciacion bacteriana.
  • Catalogos locales y terminologias.

El objetivo no es copiar toda la historia clinica. El objetivo es construir el minimo dataset util para AMR:

  • Episodio y contexto clinico minimo.
  • Muestra y tipo de muestra.
  • Aislado bacteriano.
  • Resultados AST/MIC.
  • Mecanismos de resistencia.
  • Metadatos genomicos si existen.

Tablas sinteticas

Cada nodo genera estas tablas:

Tabla Contenido
patients.csv Pacientes seudonimos con edad en bandas, sexo y region simulada
encounters.csv Episodios hospitalarios con UCI/no UCI y desenlace agregado
specimens.csv Muestras microbiologicas
isolates.csv Aislados bacterianos y grupo AMR
ast_results.csv Antibiotico, MIC, interpretacion S/I/R y breakpoint
genomics.csv Metadatos genomicos simulados, genes AMR y MLST

Tambien se genera:

  • salida/data_dictionary.json
  • salida/quality_report.json
  • salida/manifest.json

Los nodos no tienen el mismo tamano ni el mismo perfil. Cada hospital simulado tiene volumen, mezcla de patogenos, tasa UCI, disponibilidad genomica y presion de resistencia distintas para que los datos parezcan mas creibles.

Ejecutar

Desde Desarrollo:

& 'C:\ProgramData\miniconda3\python.exe' .\08_modelo_datos_amr\generar_modelo_amr.py

Relacion con ENDS/EHDS

Este modulo no implementa ENDS, EHDS, OMOP ni FHIR reales. Simula el tipo de contratos de datos que necesitariamos discutir con hospitales y socios cientificos antes de conectar nodos federados.