Паспорт базы данных можно скачать по ссылке.
Для получения данных использовались стандартные инструменты медицинской информационной системы (МИС) ФНКЦ РР, построенной на базе программного обеспечения и реляционной системы управления базами данных (СУБД) «Асклепиус» (Oracle 11g). Основной массив данных выгружался из различных модулей МИС (регистратуры, клинического, лабораторного, аптечного и др.) с использованием виртуального модуля «Конструктор запросов». Дополнительные запросы выполнялись на языке PL/SQL непосредственно из СУБД.
Все данные были деидентифицированы (анонимизированы) в соответствии с Федеральным законом №152-ФЗ «О персональных данных» с целью предоставления открытого доступа (Национальный стандарт Российской Федерации "Информатизация здоровья. Псевдонимизация" ГОСТ Р 55036-2012/ISO/TS 25237:2008, утв. приказом Федерального агентства по техническому регулированию и метрологии от 29 октября 2012 г. N 585-ст). Методика анонимизации была утверждена локальным Этическим комитетом ФНКЦ РР (№4/23/2 от 20.12.2023 г.).
Созданная база данных состоит из 11 связанных между собой таблиц. Общее число записей во всех таблицах составляет 33 047 375.
Объединяющие идентификаторы всех таблиц: new_patient_id (модифицированный ID пациента), new_hosp_id (модифицированный ID истории болезни).
База данных RICD распространяется в виде набора файлов формата .csv (frictionless data), которые могут быть загружены в любую реляционную базу данных (напр. MySQL, PostgreSQL) или BI-систему. Дополнительно представлены метаданные в формате .json, база данных в форматах .db и .pbix (Microsoft PowerBI).
Актуальная версия базы данных: RICD v3.0.
Изменения версии RICD v2.0:
1. Обновлены данные до сентября 2024 г.
2. Добавлена таблица patient_pathway
3. Обновлена структура таблицы therapy_prescriptions
4. Использованы справочники:
• Шкалы приведены к справочнику НСИ 1.2.643.5.1.13.13.11.1514 «Перечень клинических шкал и опросников»
• Для микроорганизмов использован справочник NCBI
• Для антибиотиков использован справочник НСИ 1.2.643.5.1.13.13.99.2.1095 «Антимикробные препараты, которые используются для определения чувствительности»
• Для оценки фармако-терапевтических групп использован справочник НСИ 1.2.643.5.1.13.13.99.2.540 «Лекарственные препараты. Товарные позиции. ЕСКЛП с кодами КТРУ»
• Для МНН использован справочник и справочник НСИ 1.2.643.5.1.13.2.1.1.179 «Классификатор международных непатентованных наименований лекарственных средств»
• Для лабораторных параметров использован справочник НСИ 1.2.643.5.1.13.13.11.1080 «Федеральный справочник лабораторных исследований. Справочник лабораторных тестов»
5. Оценки лабораторных параметров объединены в единую таблицу lab_data.
6. Добавлен файл базы данных RICD2.0_processed с таблицей processed_data, в которой использованы коды SQLite для оценки коморбидности пациентов, применения ИВЛ и вазоактивных препаратов, и оценки дополнительных шкал.
Данные о Государственной регистрации базы данных (смежные права)
Данные о Государственной регистрации базы данных (авторские права)
1. all_patients (10,938 записей). Медико-демографические и антропометрические харакеристики пациентов, маршрут движения, исходы госпитализации.
Поля: new_patient_id, new_hosp_id, visit_number, sex, body_weight, height, BMI, age, patient_condition_admission, transfer, adm_year, admission_department, discharge_department, hospital_length_of_stay, icu_length_of_stay, icu_free_days, fatal_outcome, data_source.
2. ICD10_diagnoses (2,995,207 записей). Диагнозы пациентов согласно классификации МКБ-10.
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, document_type, diagnosis_type, ICD_10.
3. therapy_prescriptions (2,221,844 записей). Терапевтические назначения. Данные собираются преимущественно с 2022 г.
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, prescription, inn_rus, inn_eng, pharm_group_rus, pharm_group_eng, dose, dose_unit_rus, dose_unit_eng, quantity, quantity_unit_rus, quantity_unit_eng, route_rus, route_eng, method_rus, method_eng, rate, rate_unit_rus, rate_unit_eng.
4. clinical_notes (462,332 записей). Регулярная оценка состояния пациента и диагнозы МКБ-10.
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, patient_condition, ICD_10.
5. monitoring_data (23,511,092 записей). Мониторируемые параметры* (витальные характеристики и параметры жидкостного баланса). Данные собираются преимущественно с 2019 г.
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, post_admission_minutes, parameter, unit, hour, value.
*Витальные и иные параметры: saturation (SpO2), temperature, respiratory rate, heart rate, pulse, diastolic BP, systolic BP, mean AP, body mass, glucose, respiratory volume, central venous pressure, BIS, EtCO2. *Жидкостные параметры: fluid intake per os, diuresis, enteral feeding, infusion, liquor, stool/stoma, other intake, other output, gastrostoma, drainages volume, nasogastric tube/vomitus, cystostomy, bile drainage, left abdominal drainage, left drainage, left nephrostomy, left pleural drainage, left thoracic drainage, mediastinal drainage, pelvic drainage, right abdominal drainage, right drainage, right lower quadrant drainage, right neck drainage, right nephrostomy, right pleural drainage, right thoracic drainage, right upper quadrant drainage.
6. all_scales (97,023 записей). Оценки по шкалам.
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, scale_rus, scale_eng, result*.
*Шкалы: GCS, Modified Rankin Scale, Rivermead mobility index, SOFA, APACHE II, SAPS II, Wells' Criteria for DVT, HAS-BLED, HA2DS2-VASc, Waterlow, Caprini, FOUR, CRS-R, DRS, Classification of surgical and anesthesia risk (MNOAR), NIHSS, Modified Ashworth Scale, Geneva scale, Barthel index, Functional Independence Measure (FIM), Rehabilitation routing scale.
7. detailed_sofa (38,238 записей). Подробная структура оценки по шкале SOFA.
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, report, sofa_score, FiO2 %, PaO2, PaO2/FiO2, mechanical_ventilation, platelets, GSC_score, bilirubin, systolic_AP, diastolic_AP, mean_AP, vasoactive_drugs, creatinine, daily_diuresis.
8. lab_data (3,479,246 записей). Результаты лабораторных исследований.
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, analysis_rus, analysis_eng, biomaterial_rus, biomaterial_eng, parameter_rus, parameter_eng, parameter_eng_short, unit_rus, unit_eng, result_rus, result_eng, result_num, reference_rus, reference_eng, analyzer_rus, analyzer_eng
9. antibiotic_resistance (200,524 записей). Результаты оценки антибиотикорезистентности.
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, biomaterial_rus, biomaterial_eng, material_number, strain_number, microorganism, antibiotic_rus, antibiotic_eng, minimum_inhibitory_concentration(MIC), sensitive_intermediate_resistant(SIR), resistance_marker_at_the_strain_level_1_rus, resistance_marker_at_the_strain_level_1_eng, resistance_marker_at_the_strain_level_2_rus, resistance_marker_at_the_strain_level_2_eng, resistance_marker_at_the_strain_level_3_rus, resistance_marker_at_the_strain_level_3_eng, resistance_marker_at_the_strain_level_4_rus, resistance_marker_at_the_strain_level_4_eng, resistance_marker_at_the_strain_level_5_rus, resistance_marker_at_the_strain_level_5_eng.
10. bacteria_culture_test (13,838 записей). Результаты культуральных исследований (посевы).
Поля: new_patient_id, new_hosp_id, post_admission_days, post_admission_hours, material_number, biomaterial_rus, biomaterial_eng, microorganism, unit_rus, unit_eng, result_rus, result_eng, analyzer_rus, analyzer_eng.
11. patient_pathway (17,093 записей). Маршрут движения пациентов (подробный).
Поля: new_patient_id, new_hosp_id, unit_stay_number, actual_department, actual_department_admission_day, actual_department_discharge_day, actual_department_admission_hour, actual_department_discharge_hour, ICU_period, actual_department_length_of_stay, icu_admission_number.