Please use this identifier to cite or link to this item:
https://dspace.mnau.edu.ua/jspui/handle/123456789/24534| Title: | Розробка системи розпізнавання рукописного тексту з використанням машинного навчання |
| Other Titles: | Development of a handwritten text recognition system using machine learning |
| Authors: | Жебко, Олександр Олегович, науковий керівник Zhebko, Oleksandr, scientific director Балюк, Я. О. Balyuk, Ya. |
| Keywords: | нейронна мережа набір даних оптичне розпізнавання тексту згортка TensorFlow neural network dataset optical text recognition convolution |
| Issue Date: | 2025 |
| Citation: | Балюк Я. О. Розробка системи розпізнавання рукописного тексту з використанням машинного навчання : кваліфікаційна робота на здобуття ступеня вищої освіти «Бакалавр» за спеціальністю 122 – «Комп’ютерні науки» / наук. керівн. О. О. Жебко. Миколаїв : МНАУ, 2025. 65 с. |
| Abstract: | Кваліфікаційна робота присвячена розробці системи оптичного
розпізнавання рукописного тексту на основі методів машинного навчання. В
умовах активної цифровізації документообігу актуальним є створення
ефективних інструментів для автоматизованого перетворення зображень тексту
у редагований формат. Метою роботи є розробка системи для розпізнавання
рукописного тексту на основі алгоритмів машинного навчання, яка забезпечує
точне і швидке розпізнавання зображень з текстом. У роботі досліджено
сучасні алгоритми OCR, зокрема шаблонні методи, статистичні класифікатори,
згорткові нейронні мережі (CNN) та трансформери. Обґрунтовано вибір
архітектури на базі CNN для ефективного розпізнавання символів англійського
алфавіту.
Для навчання моделі використано датасет EMNIST, що містить
зображення цифр та букв у різних варіаціях. У рамках роботи було реалізовано
попередню обробку зображень, сегментацію символів, масштабування та
подання їх у формат, придатний для класифікації нейронною мережею.
Результатом стало створення системи, здатної точно визначати символи з
вхідного зображення, формувати з них текстовий рядок та адаптуватися до
умов слабкої якості зображень.
Практичне значення роботи полягає у можливості впровадження
запропонованого підходу в мобільні додатки, сканери, документообіг, освітні та
медичні системи, а також у перспективі – його масштабування для
багатомовного розпізнавання. - The qualification work is devoted to the development of a system of optical recognition of handwritten text based on machine learning methods. In the conditions of active digitalization of document flow, the creation of effective tools for automated conversion of text images into an editable format is relevant. The purpose of the work is to develop a system for handwritten text recognition based on machine learning algorithms, which provides accurate and fast recognition of images with text. The work investigates modern OCR algorithms, in particular template methods, statistical classifiers, convolutional neural networks (CNN) and transformers. The choice of architecture based on CNN for effective recognition of English alphabet characters is justified. To train the model, the EMNIST dataset was used, which contains images of numbers and letters in various variations. As part of the work, pre-processing of images, character segmentation, scaling and presentation in a format suitable for classification by a neural network were implemented. The result was the creation of a system that can accurately identify characters from the input image, form a text string from them and adapt to conditions of poor image quality. The practical significance of the work lies in the possibility of implementing the proposed approach in mobile applications, scanners, document management, educational and medical systems, and in the future - its scaling for multilingual recognition. |
| URI: | https://dspace.mnau.edu.ua/jspui/handle/123456789/24534 |
| Appears in Collections: | Кваліфікаційні роботи (Факультет менеджменту) Кваліфікаційні роботи студентів МНАУ |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Кваліфікаційна робота Балюк.pdf | 2,78 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.