LSTM-мережі для управління метантенком
- Деталі
- Категорія: Інформаційні технології, системний аналіз та керування
- Останнє оновлення: 10 листопада 2019
- Опубліковано: 09 листопада 2019
- Перегляди: 2557
Authors:
В.С.Єсілевський, Кандидат технічних наук, доцент, orcid.org/0000-0002-5935-1505, Національний університет радіоелектроніки, м. Харків, Україна, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
С.В.Дядюн, кандидат технічних наук, доцент, orcid.org/0000-0002-1910-8594, Національний університет міського господарства імені О.М. Бекетова, м. Харків, Україна; Національний університет імені В. Н. Каразіна, м. Харків, Україна, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
В.М.Кузнєцов, Кандидат технічних наук, професор, orcid.org/0000-0003-4638-5260, Старооскольський технологічний інститут імені А. А. Угарова, „Національний дослідницький технологічний університет „МІСіС“, м. Старий Оскол, Белгородська обл., Російська Федерація, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
Abstract:
Мета. Дослідження можливості застосування систем штучного інтелекту на основі нейронних мереж для підвищення ефективності технологічного процесу виробництва біогазу в метантенку шляхом оптимізації нелінійної системи управління.
Методика. Математичне та імітаційне комп’ютерне моделювання для побудови системи адаптивного управління на основі нейронної LSTM-мережі з використанням методів навчання з підкріпленням. Дослідження збіжності процесу навчання нейронної мережі на нелінійній математичній моделі технологічного процесу.
Результати. Проведений обчислювальний експеримент показав збіжність процесу навчання за 600 епізодів на моделі із двома керуючими каналами й чотирма каналами вимірювання та ефективність роботи запропонованої адаптивної системи управління для програмної моделі технологічного процесу. Отримані результати підтверджують принципову можливість використання цього підходу для управління реальним процесом виробництва біогазу в метантенку.
Наукова новизна. Показано, що задача управління отриманням біогазу в метантенку може бути вирішена на основі підходу навчання з підкріпленням, реалізованого для неперервної нелінійної динамічної системи. Система може бути реалізована у вигляді двох нейронних мереж в архітектурі актор-критик. Для побудови модуля критики й модуля нейроконтролера системи адаптивного управління запропоновано використовувати архітектуру нейронної мережі на основі спеціального виду рекурсивної нейронної мережі ‒ LSTM нейронних мереж, що раніше не використовувалася для управління виробництвом біогазу в метантенку.
Практична значимість. Запропонований метод побудови системи управління метантенку призведе до підвищення ефективності виробництва біогазу як альтернативного поновлюваного джерела енергії. Розширення сфери застосування метантенків також вплине на вирішення проблеми утилізації промислових і побутових відходів життєдіяльності людини.
References.
1. Grando, R. L., de Souza Antune, A. M., Da Fonseca, F. V., Sánchez, A., Barrena, R., & Font, X. (2017). Technology overview of biogas production in anaerobic digestion plants: a European evaluation of research and development. Renewable and Sustainable Energy Reviews, 80, 44-53.
2. Malina, J. (2017). Design of Anaerobic Processes for Treatment of Industrial and Muncipal Waste, Volume VII. Routledge.
3. Rincón, A., Villa, J., Angulo, F., & Olivar, G. (2014). A Dynamic Analysis for an Anaerobic Digester: Stability and Bifurcation Branches. In Mathematical Problems in Engineering, 2014.
4. Jimenez, J., Latrille, E., Harmand, J., Robles, A., Ferrer, J., Gaida, D., … & Mendez-Acosta, H. (2015). Instrumentation and control of anaerobic digestion processes: a review and some research challenges. Reviews in Environmental Science and Bio/Technology, 14(4), 615-648.
5. Oppong, G., & Montague, G. (2013). Towards Model Predictive Control on Anaerobic Digestion Process. IFAC Proceedings Volumes, 46(32), 684-689. DOI: 10.3182/20131218-3-IN-2045.00063.
6. Lei Xue, Li, D., & Xi, Y. (2015). Nonlinear model predictive control of anaerobic digestion process based on reduced ADM1. In 10 th Asian Control Conference (ASCC), 2015. 31 May–3 June 2015. DOI: 10.1109/ASCC.2015.7244539.
7. Mnih, V., Kavukcuoglu, K., Silver, D., Andrei A. Rusu, Veness, J., Marc G. Bellemare, … & Hassabis, D. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533.
8. Timothy P. Lillicrap, Jonathan J. Hunt, Pritzel, A., Heess, N., Erez, T., Tassa, Y., … & Daan Wierstra (2015). Continuous control with deep reinforcement learning. Retrieved from https://arxiv.org/abs/1509.02971.
9. Spielberg, S., Gopaluni, R. B., & Loewen, P. D. (2017). Deep reinforcement learning approaches for process control. In 6 th International Symposium on Advanced Control of Industrial Processes (AdCONIP) (pp. 201-206). DOI: 10.1109/ADCONIP.2017.7983780. 2017.
10. Russell, S. J., & Norvig, P. (2016). Artificial intelligence: a modern approach. Malaysia: Pearson Education Limited.
11. David, S., Lever, G., Heess, N., Degris, T., Wierstra, D., & Riedmiller, M. (2014). Deterministic policy gradient algorithms. In Proceedings of the 31st International Conference on Machine Learning, Beijing, China, 2014. JMLR: W&CP, volume 32.
12. Ghavamzadeh, M., Mannor, S., Pineau, J., & Tamar, A. (2015). Bayesian reinforcement learning: A survey. Foundations and Trends® in Machine Learning, 8(5-6), 359-483.
13. Van Hasselt, H., Guez, A., & Silver, D. (2016). Deep Reinforcement Learning with Double Q-Learning. AAAI, 2, p. 5.
14. Mnih, V., Badia, A.P., Mirza, M., Graves, A., Lillicrap, T., Harley, T., ... & Kavukcuoglu, K. (2016, June). Asynchronous methods for deep reinforcement learning. In International conference on machine learning (pp. 1928-1937).
15. Lillicrap, T. P., Hunt, J. J., Pritzel, A., Heess, N., Erez, T., Tassa, Y., ... & Wierstra, D. (2015). Continuous control with deep reinforcement learning. arXiv preprint arXiv:1509.02971.