Програмне виявлення україномовних текстів, згенерованих ШІ: методи, оцінки, виклики
- Деталі
- Категорія: Зміст №4 2025
- Останнє оновлення: 26 серпня 2025
- Опубліковано: 30 листопада -0001
- Перегляди: 1836
Authors:
С. Д. Приходченко*, orcid.org/0000-0002-6562-0601, Національний технічний університет «Дніпровська політехніка», м. Дніпро, Україна, Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
О. Ю. Приходченко, orcid.org/0000-0001-5080-737X, Національний технічний університет «Дніпровська політехніка», м. Дніпро, Україна, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
О. С. Шевцова, orcid.org/0000-0002-0148-5877, Національний технічний університет «Дніпровська політехніка», м. Дніпро, Україна, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
І. Г. Олішевський, orcid.org/0000-0001-8573-3366, Національний технічний університет «Дніпровська політехніка», м. Дніпро, Україна, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
* Автор-кореспондент e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
Naukovyi Visnyk Natsionalnoho Hirnychoho Universytetu. 2025, (4): 150 - 159
https://doi.org/10.33271/nvngu/2025-4/150
Abstract:
Мета. Оцінка ефективності існуючих інструментів виявлення тексту, згенерованого штучним інтелектом, для виявлення машинно-генерованого контенту у кваліфікаційних роботах студентів. Дослідження має на меті проаналізувати точність, надійність і обмеження цих методів виявлення, зокрема для текстів, написаних українською мовою, а також вивчити потенційні покращення розпізнавання вмісту ШІ.
Методика. У дослідженні використовується поєднання статистичного аналізу й експериментальної оцінки інструментів виявлення ШІ. Набір даних академічних текстів, створених ШІ і написаних людиною, використовується для оцінки точності виявлення з додатковими експериментами, проведеними для аналізу впливу мовних структур, ефектів перекладу та формалізації тексту. Дослідження також включає обчислювальні методи для вивчення рівня помилок і визначення закономірностей у розпізнаванні контенту, створеного ШІ.
Результати. Результати дослідження дають зрозуміти продуктивність поточних систем виявлення ШІ, підкреслюючи їхні сильні й слабкі сторони. Аналіз виявив значні проблеми із виявленням тексту, створеного штучним інтелектом, особливо не англійською мовою, таких як українська. Крім того, дослідження визначає вплив перекладу на точність виявлення та обговорює ефективність різних лінгвістичних і статистичних підходів.
Наукова новизна. Це дослідження робить внесок у поточний дискурс про академічну доброчесність, розглядаючи обмеження інструментів виявлення ШІ для неангломовних академічних текстів. На відміну від попередніх досліджень, що зосереджені в основному на англомовному контенті, створеному штучним інтелектом, це дослідження пропонує унікальний погляд на проблеми виявлення тексту, створеного штучним інтелектом, українською мовою, пропонуючи нові погляди на адаптацію моделей виявлення для різноманітних мовних контекстів.
Практична значимість. Результати цього дослідження є цінними для викладачів, дослідників і політиків, які займаються підтриманням академічної доброчесності в епоху генеративного ШІ. Виявляючи слабкі місця в поточних системах виявлення та пропонуючи можливі вдосконалення, дослідження створює основу для розробки більш надійних методологій виявлення ШІ, які можна ефективно застосовувати до академічних текстів кількома мовами.
Ключові слова: згенерований ШІ текст, академічна доброчесність, інструменти виявлення, вища освіта, обробка природної мови, машинне навчання, багатомовний аналіз тексту
References.
1. Shah, A., Ranka, P., Dedhia, U., Prasad, S., Muni, S., & Bhowmick, K. (2023). Detecting and Unmasking AI-Generated Texts through Explainable Artificial Intelligence using Stylistic Features. International Journal of Advanced Computer Science and Applications, 14, 110. https://doi.org/10.14569/IJACSA.2023.01410110
2. Majhi, D., & Santra, P. (2023). Scholarly Communication and Machine-Generated Text: Is it Finally AI vs AI in Plagiarism Detection? SRELS Journal of Information Management, 60, 173-181. https://doi.org/10.17821/srels/2023/v60i3/171028
3. Kumarage, T., Agrawal, G., Sheth, P., Moraffah, R., Chadha, A., Garland, J., & Liu, H. (2024). A Survey of AI-generated Text Forensic Systems: Detection, Attribution, and Characterization. https://doi.org/10.13140/RG.2.2.23893.60645
4. Rashidi, H., Fennell, B., Albahra, S., Hu, B., & Gorbett, T. (2023). The ChatGPT conundrum: Human-generated scientific manuscripts misidentified as AI creations by AI text detection tool. Journal of Pathology Informatics, 14, 100342. https://doi.org/10.1016/j.jpi.2023.100342
5. Mindner, L., Schlippe, T., & Schaaff, K. (2023). Classification of Human- and AI-Generated Texts: Investigating Features for ChatGPT. https://doi.org/10.1007/978-981-99-7947-9_12
6. Amirjalili, F., Neysani, M., & Nikbakht, A. (2024). Exploring the boundaries of authorship: a comparative analysis of AI-generated text and human academic writing in English literature. Frontiers in Education. https://doi.org/10.3389/feduc.2024.1347421
7. Ma, Y., Jiawei, L., & Yi, F. (2023). Is This Abstract Generated by AI? A Research for the Gap between AI-generated Scientific Text and Human-written Scientific Text. https://doi.org/10.48550/arXiv.2301.10416
8. Chaka, C. (2024). Reviewing the performance of AI detection tools in differentiating between AI-generated and human-written texts: A literature and integrative hybrid review. Journal of Applied Learning & Teaching, 7, 1-12. https://doi.org/10.37074/jalt.2024.7.1.14
9. Weber-Wulff, D., Anohina-Naumeca, A., Bjelobaba, S., Foltýnek, T., Guerrero-Dib, J., Popoola, O., Šigut, P., & Waddington, L. (2023). Testing of detection tools for AI-generated text. International Journal for Educational Integrity, 19. https://doi.org/10.1007/s40979-023-00146-z
10. Gotoman, J., Luna, H., Sangria, J., Cereneo, C., & Barbuco, D. (2025). Accuracy and reliability of AI-generated text detection tools: A literature review. American Journal of IR 4.0 and Beyond, 4(1), 1-9. https://doi.org/10.54536/ajirb.v4i1.3795
11. Chaka, C. (2024). Accuracy pecking order – How 30 AI detectors stack up in detecting generative artificial intelligence content in university English L1 and English L2 student essays. Journal of Applied Learning & Teaching, 7(1), 1-13. https://doi.org/10.37074/jalt.2024.7.1.33
12. Ladha, N., Yadav, K., & Rathore, P. (2023). AI-generated content detectors: Boon or bane for scientific writing. Indian Journal of Science and Technology, 16(39), 3435-3439. https://doi.org/10.17485/IJST/v16i39.1632
13. Price, G., & Sakellarios, M. (2023). The effectiveness of free software for detecting AI-generated writing. International Journal of Teaching, Learning and Education, 2(6), 31-38. https://doi.org/10.22161/ijtle.2.6.4
14. Walters, W. (2023). The effectiveness of software designed to detect AI-generated writing: A comparison of 16 AI text detectors. Open Information Science, 7. https://doi.org/10.1515/opis-2022-0158
15. László, B. (2024). Artificial Intelligence-Generated Text in Higher Education ‒ Usage and Detection in the Literature. Interdisciplinary Description of Complex Systems, 22, 238-245. https://doi.org/10.7906/indecs.22.3.1
16. Jung, M., Panizo, C., Dugan, L., Fung, M., Chen, P.-Y., & Liang, P. (2025). Group-adaptive threshold optimization for robust AI-generated text detection. arXiv Preprint. https://doi.org/10.48550/arXiv.2502.04528
17. Ji, J., Guo, J., Qiu, W., Huang, Z., Xu, Y., Lu, X., Jiang, X., Li, R., & Li, S. (2025). I know myself better, but not really greatly: Using LLMs to detect and explain LLM-generated texts. arXiv Preprint. https://doi.org/10.48550/arXiv.2502.12743
18. Shivarkar, P. (2025). LLM AI-generated text detection. International Journal of Scientific Research in Engineering and Management, 9(1), 1-9. https://doi.org/10.55041/IJSREM41593
19. Walker, E., Evans, L., Mitchell, A., Zhang, Z., Patel, R., & Chen, I. (2024). Text classification in detection of AI-generated content using BERT. ResearchGate Preprint. https://doi.org/10.13140/RG.2.2.30193.90722
20. Krois-Lindner, A. (2011). International legal English: a course for classroom or self-study use. Cambridge University Press. Cambridge professional English. ISBN 9783125351905.
Наступні статті з поточного розділу:
- Інновації у відбудові галузей промисловості України в повоєнний період - 26/08/2025 01:27
- Методологічний підхід до оцінювання параметрів впливу технологічних змін на економічну стійкість підприємств - 26/08/2025 01:27
- Менеджмент сталого розвитку: основні принципи та інструменти впливу - 26/08/2025 01:27
- Вплив інституційного середовища на інвестиційну привабливість національної економіки: міжнародний досвід - 26/08/2025 01:27
- Побудова технологічної екосистеми в умовах цифрової трансформації - 26/08/2025 01:27
- Алгоритм планування роботи водіїв на міжміських маршрутах: застосування вахтового методу роботи - 26/08/2025 01:27
- Парадигми моделювання та підвищення надійності передачі даних у VLC технологій - 26/08/2025 01:27
- Масив GNSS для моніторингу деформації конструкцій - 26/08/2025 01:27
- Розробка кластеризатора параметрів вибухонебезпечних об’єктів на основі комплексного показника - 26/08/2025 01:27
Попередні статті з поточного розділу:
- Інтеграція атомних і водневих технологій для підвищення ефективності генерації та акумулювання електроенергії - 26/08/2025 01:27
- Вплив додавання різних форм відходів шин на властивості ґрунту - 26/08/2025 01:27
- Імовірнісна деградація ґрунту через наявність важких металів навколо Ташан-Каджі, район Торо (Нігерія) - 26/08/2025 01:27
- Вплив флікера напруги на струм протікання в електромережах шахт із силовими електронними пристроями - 26/08/2025 01:27
- Математичне моделювання безконтактного високошвидкісного двигуна із постійними магнітами - 26/08/2025 01:27
- Миттєва потужність асинхронного генератора із фазним ротором при несиметрії обмоток статора - 26/08/2025 01:27
- Аналіз стійкості ґрунтових схилів на основі модифікованого критерію міцності - 26/08/2025 01:26
- Визначення граничних значень і фазових перетворень інтервалу кристалізації бронзи БрА7К2О1,5Мц0,3 - 26/08/2025 01:26
- Методика акустичного експерименту для дослідження аеродинамічного шуму сегментів лопатей вітряних турбін - 26/08/2025 01:26
- Особливості течії газу в напівзамкнутому об’ємі при вибуху подовженого заряду конденсованої вибухової речовини - 26/08/2025 01:26




Співпраця