Інформаційна технологія нечіткої кластеризації багатовимірних часових рядів на прикладі гідрохімічного моніторингу річки Самара
- Деталі
- Категорія: Інформаційні технології, системний аналіз та керування
- Останнє оновлення: 11 листопада 2014
- Опубліковано: 11 листопада 2014
- Перегляди: 5631
Автори:
О.Г. Байбуз, доктор технічних наук, професор, Дніпропетровський національний університет ім. О. Гончара, завідувач кафедри математичного забезпечення електронних обчислювальних машин, м.Дніпропетровськ, Україна
М.Г. Сидорова, Дніпропетровський національний університет ім. О. Гончара, аспірантка, м.Дніпропетровськ, Україна
Реферат:
Мета. Розробка методів для наповнення інформаційної технології нечіткої кластеризації для випадку багатовимірних часових рядів.
Методика. У роботі представлена методика кластерного аналізу багатовимірних часових рядів у вигляді обчислювальної схеми на основі кластеризації одновимірних часових рядів, агрегування результатів у матрицю подібності та визначення на її основі результуючого нечіткого розбиття.
Результати. Адаптовані до кластеризації часових рядів обчислювальні схеми методів: агломеративного ієрархічного, К-середніх, Forel, графового методу найкоротшого незамкненого шляху, що увійшли до ядра запропонованої інформаційної технології. Проведена їх оцінка на основі критеріїв якості. Здійснена практична реалізація до даних гідрохімічного моніторингу техногенно-навантаженої території з аналізом отриманих результатів.
Наукова новизна. Запропонована нова метрика для порівняння часових рядів, яка враховує як характер порівнюваних рядів, так і близькість їх значень, що дозволяє підвищити якість кластеризації. Розроблена інформаційна технологія кластерного аналізу багатовимірних часових рядів на основі ансамблевого підходу та нечіткої логіки.
Практична значимість. На основі запропонованої технології та розробленого програмного забезпечення був проведений кластерний аналіз даних гідрохімічного моніторингу поверхневих вод Західно-Донбаського регіону (р.Самара). Це дозволило виділити групи контрольних створів, що характеризуються схожим фізико-хімічним складом води за досліджуваними компонентами для правильного планування природоохоронних заходів та керування якістю вод річки.
Список літератури / References:
1. Wang, X., Smith, K., Hyndman, R.and Alahakoon, D. (2001), “A scalable method for time series clustering”, Tech. Report Department of Econometrics and Business Statistics at Monash University, Melbourne, Australia.
2. Паршутин С.В. Кластеризация временных рядов с применением карт самоорганизации: сборник научных трудов /С.В. Паршутин // Интегрированные модели и мягкие вычисления в искусственном интеллекте. – Коломна. – 2007. – C. 465–472.
Parshutin, S.V. (2007), “Time series clustering with application of Self-Organizing Maps”, Int. Conf. Proc. “Integrated Models and Soft Computing in Artificial Intelligence”, Kolomna, pp. 465–472.
3. Iglesias, F. and Kastner, W., (2013), “Analysis of similarity measures in times series clustering for the discovery of building energy patterns”, Energies, Vol. 6, pp. 579–597.
4. Alcock, R.J. and Manolopoulos, Y., (1999), “Time-Series Similarity Queries Employing a Feature-Based Approach.”, 7th Hellenic Conference on Informatics. August 27–29, Ioannina, Greece.
5. Liao, T.W., (2005), “Clustering of time series data – survey”, Pattern Recognition, Vol. 38, pp. 1857–1874.
6. Rani, S., Sikka, G., (2012), “Recent Techniques of Clustering of Time Series Data: A Survey”, International Journal of Computer Applications, Vol. 32, no. 15, pp. 1–9.
7. Гусарова Л. Проверка обоснованности кластерного решения / Л. Гусарова, И. Яцкив // Reliability and statistics in transportation and communication (RelStat). – 2004. –Т. 5. – № 2. – С. 49–56.
Gusarova, L. and Yatskіv, I., (2003),“Checking of the cluster solution validity”, Proc. of Int. Conf. RelStat, Vol. 5, no. 2, pp. 49–56.
8. Вятченин Д.А. Нечеткие методы автоматической классификации: монография / Вятченин Д.А. – Минск: УП „Технопринт“, 2004. – 219с.
Vyatchenin, D.A., (2004), Nechetkie metody avtomaticheskoy klassifikatsii [Fuzzy Methods of Automatic Classification], Monograph, Tehnoprint, Minsk, Belarus.
9. Яцкив И. Методы определения количества кластеров при классификации без обучения / И. Яцкив, Л. Гусарова // Transport and Telecommunication. – 2003. – T. 4. – №1. – C. 23–28.
Yatskіv, I. and Gusarova, L., (2003), “Methods for determining the number of clusters in unsupervised classification”, Transport and Telecommunication, Vol. 4, no. 1, pp. 23–28.
2014_5_baibuz | |
2014-11-10 229.46 KB 952 |