README del modulo
08 Modelo de datos AMR mas realista
Este modulo evoluciona el CSV simple del inicio hacia un modelo AMR relacional y mas parecido a lo que un nodo hospitalario tendria que normalizar antes de participar en PROTEONEXT.
No usa datos reales. Todo es sintetico y pedagogico.
Problema que resuelve
En un hospital real, los datos no llegan como una tabla limpia. Suelen estar repartidos entre:
- Sistemas clinicos.
- LIS/microbiologia.
- Antibiogramas y MIC.
- Secuenciacion bacteriana.
- Catalogos locales y terminologias.
El objetivo no es copiar toda la historia clinica. El objetivo es construir el minimo dataset util para AMR:
- Episodio y contexto clinico minimo.
- Muestra y tipo de muestra.
- Aislado bacteriano.
- Resultados AST/MIC.
- Mecanismos de resistencia.
- Metadatos genomicos si existen.
Tablas sinteticas
Cada nodo genera estas tablas:
| Tabla | Contenido |
|---|---|
patients.csv |
Pacientes seudonimos con edad en bandas, sexo y region simulada |
encounters.csv |
Episodios hospitalarios con UCI/no UCI y desenlace agregado |
specimens.csv |
Muestras microbiologicas |
isolates.csv |
Aislados bacterianos y grupo AMR |
ast_results.csv |
Antibiotico, MIC, interpretacion S/I/R y breakpoint |
genomics.csv |
Metadatos genomicos simulados, genes AMR y MLST |
Tambien se genera:
salida/data_dictionary.jsonsalida/quality_report.jsonsalida/manifest.json
Los nodos no tienen el mismo tamano ni el mismo perfil. Cada hospital simulado tiene volumen, mezcla de patogenos, tasa UCI, disponibilidad genomica y presion de resistencia distintas para que los datos parezcan mas creibles.
Ejecutar
Desde Desarrollo:
& 'C:\ProgramData\miniconda3\python.exe' .\08_modelo_datos_amr\generar_modelo_amr.py
Relacion con ENDS/EHDS
Este modulo no implementa ENDS, EHDS, OMOP ni FHIR reales. Simula el tipo de contratos de datos que necesitariamos discutir con hospitales y socios cientificos antes de conectar nodos federados.