МЕТОДИ ТА МОДЕЛІ DATA SCIENCE В СУЧАСНІЙ ЕКОНОМІЦІ
Анотація
In contemporary economics, data science models play a crucial role in analyzing complex relationships, predicting economic trends, and informing policy decisions. This article reviews the most commonly used data science models in economics, including econometric models like linear and logistic regression, Probit and Tobit models, time series analysis models such as ARIMA and Vector Autoregression (VAR), and panel data analysis methods like fixed and random effects models and Difference-in-Differences (DiD). Additionally, it explores machine learning algorithms, clustering and classification techniques, dimensionality reduction methods, Bayesian methods, and natural language processing (NLP) applications. The article highlights their purposes, applications, and relevant works, emphasizing the strengths and limitations of each model. It also discusses the impact of these models across various sectors, including finance, retail, energy, and healthcare. This comprehensive overview underscores the importance of aligning data science models with business objectives, ensuring data quality, investing in scalable technologies, fostering a data-driven culture, and addressing ethical considerations. The article concludes with future research directions, such as advanced neural network architectures, large language models, generative AI models, hybrid models, and the need for interpretable and ethical AI applications in economics. The importance of this topic lies in the transformative potential of data science models to enhance economic analysis and decision-making. By leveraging advanced data science techniques, economists can gain deeper insights into complex economic phenomena, improve forecasting accuracy, and develop more effective policies. As data-driven approaches continue to evolve, they provide powerful tools for addressing critical economic challenges, driving innovation, and fostering sustainable growth across various sectors.
У сучасній економіці моделі на основі Data Science відіграють вирішальну роль в аналізі складних взаємозв'язків, прогнозуванні економічних тенденцій та прийнятті політичних рішень. У статті розглянуто найбільш поширені моделі науки про дані в економіці, включаючи економетричні моделі, такі як лінійна та логістична регресія, моделі Probit і Tobit, моделі аналізу часових рядів, такі як ARIMA та векторна авторегресія (VAR), а також методи аналізу панельних даних, такі як фіксовані та випадкові ефекти і методи різниці в різницях (DiD). Крім того, досліджуються алгоритми машинного навчання, методи кластеризації та класифікації, методи зменшення розмірності, байєсівські методи та застосування обробки природної мови (NLP). У статті висвітлено їх призначення, застосування та відповідні роботи, підкреслено сильні та слабкі сторони кожної моделі. Також розглянуто вплив цих моделей у різних секторах, включаючи фінанси, роздрібну торгівлю, енергетику та охорону здоров'я. Цей комплексний огляд підкреслює важливість узгодження застосування методів та моделей Data Science з бізнес-цілями, забезпечення якості даних, інвестування в масштабовані технології, формування культури, заснованої на даних, та врахування етичних аспектів. У статті робиться висновок про напрями майбутніх досліджень, такі як дослідження особливостей використання розширеної архітектури нейронних мереж, великих мовних моделей, генеративних моделей штучного інтелекту, гібридних моделей та необхідність інтерпретованих і етичних застосувань штучного інтелекту в економіці. Важливість цієї теми полягає в трансформаційному потенціалі моделей науки про дані для покращення економічного аналізу та прийняття рішень. Використовуючи передові методи та моделі Data Science, економісти можуть глибше зрозуміти складні економічні явища, покращити точність прогнозування та розробити більш ефективні політики. Оскільки підходи на основі даних продовжують розвиватися, вони надають потужні інструменти для вирішення критичних економічних проблем, стимулювання інновацій та забезпечення сталого зростання в різних секторах.
Посилання
Kiv A. E., Soloviev V. N., Semerikov S. O., Danylchuk H. B., Kibalnyk, L. O., Matviychuk A. V., Striuk A. M. (2021) Machine learning for prediction of emergent economy dynamics / In A. E. Kiv, V. N. Soloviev, S. O. Semerikov (Eds.) Proceedings of the Selected and Revised Papers of 9th International Conference on Monitoring, Modeling & Management of Emergent Economy (M3E2-MLPEED 2021), Odessa, Ukraine, May 26-28, 2021 (Vol. 3048, pp. i-xxxi). CEUR Workshop Proceedings. Available at: http://ceur-ws.org/Vol-3048/paper00.pdf
Nosratabadi S., Mosavi A., Duan P., Ghamisi P., Filip F., Shahab S., Band S., Reuter U., Gama J., Gandomi A. H. (2020) Data science in economics: Comprehensive review of advanced machine learning and deep learning methods. Mathematics, no. 8(10). DOI: https://doi.org/10.3390/MATH8101799
Nosratabadi S., Mosavi A., Duan P., Ghamisi P. (2020) Data science in economics. arXiv: General Finance. DOI: https://doi.org/10.21203/RS.3.RS-27318/V1
Consoli S., Recupero D. R., Saisana, M. (2021) Data science for economics and finance: Methodologies and applications. DOI: https://doi.org/10.1007/978-3-030-66891-4
Domyan E. N. (2022) Technique for data analysis and modeling in economics, finance and business using machine learning methods. SUMMA. DOI: https://doi.org/10.1109/summa57301.2022.9973885
Barbaglia L., Consoli S., Manzan S., Reforgiato Recupero D., Saisana M., Tiozzo Pezzoli L. (2021) Data science technologies in economics and finance: A gentle walk-in. In Data Science for Economics and Finance (pp. 1-17). DOI: https://doi.org/10.1007/978-3-030-66891-4_1
Baldelovar M. A. (2022) Assessing data science's application to economic theory. Technoarete Transactions on Advances in Data Science and Analytics, no 1(2). DOI: https://doi.org/10.36647/ttadsa/01.02.a005
Tarasov O. F., Turlakova S. S. (2018) Mathematical modelling of advanced engineering technologies for smart enterprises: An overview of approaches and ways of implementation. Economy of Industry.
Vishnevskyi V. P., Dasiv A. F., Okhten O. O., Turlakova, S. S. (2022) Industrialne maibutnie Ukrainy: peredbachennia metodamy matematychnoho modeliuvannia [The industrial future of Ukraine: Predictions using mathematical modeling methods]. Kyiv: NAN Ukrainy, Instytut ekonomiky prom-sti. (in Ukrainian)
Wooldridge J. M. (2002) Econometric analysis of cross section and panel data. MIT Press. London, England.
Hosmer D. W., Lemeshow S., Sturdivant R. X. (2013) Applied logistic regression (3rd ed.). Wiley.
Koop G. (2005) Analysis of economic data (3rd ed.). Wiley.
Hamilton J. D. (1994) Time series analysis. Princeton University Press.
Lütkepohl H. (2005) New introduction to multiple time series analysis. Springer.
Hyndman R. J., Athanasopoulos G. (2021) Forecasting: Principles and practice (3rd ed.). OTexts. Available at: https://otexts.com/fpp3/
Arellano M. (2003) Panel data econometrics. Oxford University Press.
Angrist J. D., Pischke J.-S. (2008) Mostly harmless econometrics: An empiricist's companion. Princeton University Press.
Hastie T., Tibshirani R., Friedman J. (2009) The elements of statistical learning (2nd ed.). Springer.
Schölkopf B., Smola A. J. (2002) Learning with kernels: Support vector machines, regularization, optimization, and beyond. MIT Press.
Bishop C. M. (1995) Neural networks for pattern recognition. Oxford University Press.
Lopez de Prado M. (2018) Advances in financial machine learning. Wiley.
Witten I. H., Frank E., Hall, M. A. (2011) Data mining: Practical machine learning tools and techniques (3-rd ed.). Morgan Kaufmann.
Manly B. F. J. (2004) Multivariate statistical methods: A primer (3rd ed.). Chapman and Hall/CRC.
Aggarwal C. C., Reddy, C. K. (2013) Data clustering: Algorithms and applications. CRC Press.
Faraway J. J. (2014) Modern multivariate statistical techniques: Regression, classification, and manifold learning. Chapman and Hall/CRC.
Cudeck R., MacCallum R. (Eds.). (2007) Factor analysis at 100: Historical developments and future directions. Lawrence Erlbaum Associates.
Gelman A., Carlin J. B., Stern H. S., Dunson D. B., Vehtari A., Rubin D. B. (2013) Bayesian data analysis (3rd ed.). CRC Press.
Berry M. W., Kogan J. (Eds.). (2010) Text mining: Applications and theory. Wiley.
Blei D. M., Ng A. Y., Jordan M. I. (2003) Latent Dirichlet allocation. Journal of Machine Learning Research, no 3(Jan), pp.993-1022.
Walsh B., Lynch M. (2018) Evolution and selection of quantitative traits. Oxford University Press.
Wood S. N. (2017) Generalized additive models: An introduction with R (2nd ed.). Chapman and Hall/CRC.
Blei D. M. (2012) Probabilistic topic models. Communications of the ACM, no 55(4), pp. 77–84.
Morgan J.P. (2023) J.P. Morgan's annual report. Available at: https://www.jpmorganchase.com/ir/annual-report
Walmart (2023) Walmart's business intelligence strategy. Retri Available at: https://corporate.walmart.com/newsroom
PG&E (2023) PG&E energy statements. Available at: https://www.pge.com/about/newsroom/
Federal Reserve Bank (2023) Federal Reserve Bank research. Available at: https://www.federalreserve.gov/econres.htm
Johns Hopkins Medicine (2023) Johns Hopkins Medicine news. Available at: https://www.hopkinsmedicine.org/news