<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">Russian Journal of Infection and Immunity</journal-id><journal-title-group><journal-title xml:lang="en">Russian Journal of Infection and Immunity</journal-title><trans-title-group xml:lang="ru"><trans-title>Инфекция и иммунитет</trans-title></trans-title-group></journal-title-group><issn publication-format="print">2220-7619</issn><issn publication-format="electronic">2313-7398</issn><publisher><publisher-name xml:lang="en">SPb RAACI</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">17548</article-id><article-id pub-id-type="doi">10.15789/2220-7619-FIF-17548</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>ORIGINAL ARTICLES</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>ОРИГИНАЛЬНЫЕ СТАТЬИ</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Forecasting infection fatality rate of COVID-19: measuring the efficiency of several hybrid models</article-title><trans-title-group xml:lang="ru"><trans-title>Прогнозирование уровня летальности при COVID-19: оценка эффективности некоторых гибридных моделей</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Seba</surname><given-names>D.</given-names></name><name xml:lang="ru"><surname>Себа</surname><given-names>Д.</given-names></name></name-alternatives><address><country country="DZ">Algeria</country></address><bio xml:lang="en"><p>Doctor in Mathematics, Assistant Professor, Laboratory of Applied Mathematics, Department of Mathematics</p></bio><bio xml:lang="ru"><p>д.мат.н., доцент, лаборатория прикладной математики, факультет математики</p></bio><email>d.seba@esi-sba.dz</email><xref ref-type="aff" rid="aff1"/><xref ref-type="aff" rid="aff2"/></contrib><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Belaide</surname><given-names>K.</given-names></name><name xml:lang="ru"><surname>Белаиде</surname><given-names>К.</given-names></name></name-alternatives><address><country country="DZ">Algeria</country></address><bio xml:lang="en"><p>Doctor in Mathematics, Full Professor, Laboratory of Applied Mathematics, Department of Mathematics</p></bio><bio xml:lang="ru"><p>д.мат.н., профессор, лаборатория прикладной математики, факультет математики</p></bio><email>d.seba@esi-sba.dz</email><xref ref-type="aff" rid="aff1"/><xref ref-type="aff" rid="aff2"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">Higher School of Informatics</institution></aff><aff><institution xml:lang="ru">Высшая школа информатики</institution></aff></aff-alternatives><aff-alternatives id="aff2"><aff><institution xml:lang="en">University of Bejaia</institution></aff><aff><institution xml:lang="ru">Университет Беджаи</institution></aff></aff-alternatives><pub-date date-type="preprint" iso-8601-date="2024-04-16" publication-format="electronic"><day>16</day><month>04</month><year>2024</year></pub-date><pub-date date-type="pub" iso-8601-date="2024-06-05" publication-format="electronic"><day>05</day><month>06</month><year>2024</year></pub-date><volume>14</volume><issue>2</issue><issue-title xml:lang="en"/><issue-title xml:lang="ru"/><fpage>313</fpage><lpage>319</lpage><history><date date-type="received" iso-8601-date="2023-12-08"><day>08</day><month>12</month><year>2023</year></date><date date-type="accepted" iso-8601-date="2024-04-07"><day>07</day><month>04</month><year>2024</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2024, Seba D., Belaide K.</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2024, Себа Д., Белаиде К.</copyright-statement><copyright-year>2024</copyright-year><copyright-holder xml:lang="en">Seba D., Belaide K.</copyright-holder><copyright-holder xml:lang="ru">Себа Д., Белаиде К.</copyright-holder><ali:free_to_read xmlns:ali="http://www.niso.org/schemas/ali/1.0/"/><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by/4.0</ali:license_ref></license></permissions><self-uri xlink:href="https://iimmun.ru/iimm/article/view/17548">https://iimmun.ru/iimm/article/view/17548</self-uri><abstract xml:lang="en"><p>The main goal of this paper is to delve into a crucial epidemiological metric the daily infection fatality rate in the context of the ongoing COVID-19 pandemic. The significance of understanding this metric lies in its potential to provide insights into the severity and impact of the virus on a daily basis. Methods: To achieve this overarching objective, we employ a comprehensive approach by applying various hybrid models that hybridize both machine learning and statistical techniques. In our pursuit of a deeper understanding, we leverage advanced machine learning algorithms, including Support Vector Machine and Random Forest. These techniques allow us to capture intricate patterns and relationships within the data, contributing to a more nuanced analysis of the infection fatality rate. The application of machine-learning models in epidemiological studies has gained prominence due to their ability to adapt to complex and evolving patterns inherent in infectious disease dynamics. Complementing our machine-learning arsenal, we integrate traditional statistical models such as ARIMA (AutoRegressive Integrated Moving Average), fractional ARIMA, and BATS (Bayesian Structural Time Series). Results. To assess the performance of these models, we employ key evaluation metrics, including Root Mean Squared Error (RMSE), Mean Squared Error (MSE), and Mean Absolute Error (MAE). These metrics serve as critical benchmarks, allowing us to quantify the accuracy and reliability of our models in predicting the daily infection fatality rate. A meticulous evaluation of model performance is crucial for ensuring the validity and of our findings. According to these measures, we see that hybrid models performed well especially ARIMA-RF model RMSE: 0.29, MSE: 0.084, MAE: 0.215 for the horizon 60 and for horizon 120 ARIMA-RF still the best performance, RMSE: 0.268, MSE: 0.071, MAE: 0.183, we get these results due to the capacity of this approach to handle complex patterns contrarily to other model ARIMA, BATS, RF and SVM. Conclusion. This work adopted this approach in order to build a model to predict infection fatality rate, we aspire to provide a nuanced understanding of the factors influencing the severity of the virus, ultimately contributing to the ongoing discourse on effective public health interventions and mitigation strategies.</p></abstract><trans-abstract xml:lang="ru"><p>История вопроса. Основная цель этой статьи заключается в углублении понимания роли важнейшего эпидемиологического показателя — коэффициента летальности при заражении на фоне продолжающейся пандемии COVID-19. Важность понимания этого показателя состоит в том, что он позволяет ежедневно оценивать выраженность вирусного инфицирования и ее воздействие. Материалы и методы. Для достижения этой всеобъемлющей цели мы применяем комплексный подход, используя различные гибридные модели, объединяющие машинное обучение и статистические методы. Углубленное понимание значимости указанного параметра достигается с использованием передовых алгоритмов машинного обучения, включая машину опорных векторов и случайные деревья решений. Эти методы позволяют обнаруживать сложные закономерности и взаимосвязи в данных, способствуя более детальному анализу уровня смертности от инфекций. Применение моделей машинного обучения в эпидемиологических исследованиях приобрело известность благодаря их способности адаптироваться к сложным и развивающимся закономерностям, присущим динамике инфекционных заболеваний. Дополняя доступный арсенал машинного обучения, мы совмещаем традиционные статистические модели, такие как ARIMA (авторегрессионное интегрированное скользящее среднее), дробное ARIMA и BATS (байесовский структурный временной ряд). Эти модели обеспечивают проверенную временем и строгую статистическую основу для проводимого анализа, позволяя выявить временные зависимости и тенденции коэффициента летальности при заражении. Синергия машинного обучения и статистических моделей дает нашему исследованию целостную перспективу, обеспечивая надежное и всестороннее исследование эпидемиологической ситуации. Результаты. Для оценки эффективности этих моделей мы используем ключевые показатели оценки, включая среднеквадратическую ошибку (RMSE), среднеквадратическую ошибку (MSE) и среднюю абсолютную ошибку (MAE). Эти показатели служат важнейшими ориентирами, позволяя нам количественно оценить точность и надежность наших моделей при прогнозировании ежедневного коэффициент летальности при заражении. Тщательная оценка эффективности модели имеет решающее значение для обеспечения достоверности наших выводов. Согласно этим измерениям, гибридные модели показали хорошие результаты, особенно модель ARIMA-RF RMSE: 0.29, MSE: 0.084, MAE: 0.215 для горизонта 60 и для горизонта 120 ARIMA-RF по-прежнему демонстрировали лучшую производительность, RMSE: 0.268, MSE: 0.071, MAE: 0.183 позволили получить такие результаты благодаря способности этого подхода обрабатывать сложные шаблоны в отличие от моделей ARIMA, BATS, RF и SVM. Заключение. В данной работе применялся подход для построения модели по прогнозированию уровня коэффициента летальности при заражении, нацеленный на предоставление детального понимания факторов, влияющих на тяжесть вирусного инфицирования. В конечном итоге это будет способствовать продолжающемуся обсуждению эффективных мер общественного здравоохранения и стратегий нивелирования последствий.</p></trans-abstract><kwd-group xml:lang="en"><kwd>epidemiology</kwd><kwd>infection fatality rate</kwd><kwd>forecast</kwd><kwd>statistical models</kwd><kwd>machine learning</kwd><kwd>performance</kwd><kwd>hybrid model</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>эпидемиология</kwd><kwd>коэффициент летальности при заражении</kwd><kwd>прогноз</kwd><kwd>статистические модели</kwd><kwd>машинное обучение</kwd><kwd>производительность</kwd><kwd>гибридная модель</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><mixed-citation>Acosta-González E., Andrada-Félix J., Fernández-Rodríguez F. On the evolution of the COVID-19 epidemiological parameters using only the series of deceased. A study of the Spanish outbreak using Genetic Algorithms. Math. Comput. Simul., 2022, vol. 197, pp. 91–104. doi: 10.1016/j.matcom.2022.02.007</mixed-citation></ref><ref id="B2"><label>2.</label><mixed-citation>Ahmar A.S., Boj E. Application of neural network time series (Nnar) andarima to forecast infection fatality rate (ifr) of COVID-19 in Brazil. International Journal on Informatics Visualization, 2021, vol. 5, no. 1, pp. 8–10. doi: 10.30630/joiv.5.1.372</mixed-citation></ref><ref id="B3"><label>3.</label><mixed-citation>Alazab M., Awajan A., Mesleh A., Abraham A., Jatana V., Alhyari S. COVID-19 prediction and detection using deep learning. International Journal of Computer Information Systems and Industrial Management Applications, 2020, no. 12, pp. 168–181.</mixed-citation></ref><ref id="B4"><label>4.</label><mixed-citation>Alzahrani S.I., Aljamaan I.A., Al-Fakih E.A. Forecasting the spread of the COVID-19 pandemic in Saudi Arabia using ARIMA prediction model under current public health interventions. J. Infect. Public Health, 2020, vol. 13, no. 7, pp. 914–919. doi: 10.1016/j.jiph.2020.06.001</mixed-citation></ref><ref id="B5"><label>5.</label><mixed-citation>ArunKumar K.E., Kalaga D.V., Kumar C.M.S., Kawaji M., Brenza T.M. Comparative analysis of Gated Recurrent Units (GRU), long Short-Term memory (LSTM) cells, autoregressive Integrated moving average (ARIMA), seasonal autoregressive Integrated moving average (SARIMA) for forecasting COVID-19 trends. Alexandria Engineering Journal, 2022, vol. 61, no. 10, pp. 7585–7603. doi: 10.1016/j.aej.2022.01.011</mixed-citation></ref><ref id="B6"><label>6.</label><mixed-citation>Beran J. Statistics for long- memory processes. CRC press, 1994. Vol. 61. doi: 10.1201/9780203738481</mixed-citation></ref><ref id="B7"><label>7.</label><mixed-citation>Box G.E., Jenkins G.M., Reinsel G.C., Ljung G.M. Time series analysis: forecasting and control; 5th ed. John Wiley and Sons, 2015. doi: 10.1002/9781118619193</mixed-citation></ref><ref id="B8"><label>8.</label><mixed-citation>Dehesh T., Mardani-Fard H.A., Dehesh P. Forecasting of COVID-19 confirmed cases in different countries with ARIMA models. MedRxiv, 2020.03.13.20035345. doi: 10.1101/2020.03.13.20035345</mixed-citation></ref><ref id="B9"><label>9.</label><mixed-citation>Chen J.M. Novel statistics predict the COVID-19 pandemic could terminate in 2022. J. Med. Virol., 2022, vol. 94, no. 6, pp. 2845–2848. doi: 10.1002/jmv.27661</mixed-citation></ref><ref id="B10"><label>10.</label><mixed-citation>Deif M.A., Solyman A.A., Hammam R.E. ARIMA model estimation based on genetic algorithm for COVID-19 mortality rates. International Journal of Information Technology and Decision Making, 2021, vol. 20, no. 6,pp. 1775–1798. doi: 10.1142/S0219622021500528</mixed-citation></ref><ref id="B11"><label>11.</label><mixed-citation>De Livera A.M., Hyndman R.J., Snyder R.D. Forecasting time series with complex seasonal patterns using exponential smoothing. Journal of the American statistical association, 2011, vol. 106, no. 496, pp. 1513–1527. doi: 10.1198/jasa.2011.tm09771</mixed-citation></ref><ref id="B12"><label>12.</label><mixed-citation>Kapoor A., Ben X., Liu L., Perozzi B., Barnes M., Blais M., O’Banion S. Examining COVID-19 forecasting using spatio-temporal graph neural networks. arXiv, 2020: 2007.03113 [Preprint]. doi: doi: 10.48550/arXiv.2007.03113</mixed-citation></ref><ref id="B13"><label>13.</label><mixed-citation>Lukman A.F., Rauf R.I., Abiodun O., Oludoun O., Ayinde K., Ogundokun R.O. COVID-19 prevalence estimation: Four most affected African countries. Infect. Dis. Model., 2020, vol. 5, pp. 827–838. doi: 10.1016/j.idm.2020.10.002</mixed-citation></ref><ref id="B14"><label>14.</label><mixed-citation>Namasudra S., Dhamodharavadhani S., Rathipriya R. Nonlinear Neural Network Based Forecasting Model for Predicting COVID-19 Cases. Neural. Process. Lett., 2023, vol. 55, no. 1, pp. 171–191. doi: 10.1007/s11063-021-10495-w</mixed-citation></ref><ref id="B15"><label>15.</label><mixed-citation>Rath S., Tripathy A., Tripathy A.R. Prediction of new active cases of coronavirus disease (COVID-19) pandemic using multiple linear regression model. Diabetes Metab. Syndr., 2020, vol. 14, no. 5, pp. 1467–1474. doi: 10.1016/j.dsx.2020.07.045</mixed-citation></ref><ref id="B16"><label>16.</label><mixed-citation>Roy S., Bhunia G.S., Shit P.K. Spatial prediction of COVID-19 epidemic using ARIMA techniques in India. Model. Earth Syst. Environ., 2021, vol. 7, no. 2, pp. 1385–1391. doi: 10.1007/s40808-020-00890-y</mixed-citation></ref><ref id="B17"><label>17.</label><mixed-citation>Salgotra R., Gandomi M., Gandomi A.H. Time Series Analysis and Forecast of the COVID-19 Pandemic in India using Genetic Programming. Chaos Solitons Fractals, 2020, no. 138: 109945. doi: 10.1016/j.chaos.2020.109945</mixed-citation></ref><ref id="B18"><label>18.</label><mixed-citation>Singh A., Bajpai M.K. SEIHCRD Model for COVID-19 spread scenarios, disease predictions and estimates the basic reproduction number, case fatality rate, hospital, and ICU beds requirement. ComputerModeling in Engineering &amp; Sciences, 2020, vol. 125, no. 3, pp. 991–1031. doi: 10.32604/cmes.2020.012503</mixed-citation></ref><ref id="B19"><label>19.</label><mixed-citation>Tamang S.K., Singh P.D., Datta B. Forecasting of COVID-19 cases basedon prediction using artificial neural network curve fitting technique. Global Journal of Environmental Science and Management, 2020, vol. 6, special iss. (COVID-19), pp. 53–64. doi: 10.22034/GJESM.2019.06.SI.06</mixed-citation></ref><ref id="B20"><label>20.</label><mixed-citation>Tipping M. The relevance vector machine. Advances in Neural Information Processing Systems 12. 1999, pp. 652–658.</mixed-citation></ref><ref id="B21"><label>21.</label><mixed-citation>Vapnik V. The Nature of Statistical Learning Theory. Springer, New York, 1995.</mixed-citation></ref><ref id="B22"><label>22.</label><mixed-citation>Vattay G. Forecasting the outcome and estimating the epidemic model parameters from the fatality time series in COVID-19 outbreaks. Phys. Biol., 2020, vol. 17, no. 6: 065002. doi: 10.1088/1478-3975/abac69</mixed-citation></ref><ref id="B23"><label>23.</label><mixed-citation>Yousaf M., Zahir S., Riaz M., Hussain S.M., Shah K. Statistical analysis of forecasting COVID-19 for upcoming month in Pakistan. Chaos Solitons Fractals, 2020, no. 138: 109926. doi: 10.1016/j.chaos.2020.109926</mixed-citation></ref><ref id="B24"><label>24.</label><mixed-citation>Zeroual A., Harrou F., Dairi A., Sun Y. Deep learning methods for forecasting COVID-19 time-Series data: A Comparative study. Chaos Solitons Fractals, 2020, no. 140: 110121. doi: 10.1016/j.chaos.2020.110121</mixed-citation></ref></ref-list></back></article>
