1) Тип капч: -Капчи представляют собой текстовые изображения (пример капчи прилагается). 2)Формат хранения данных: - Имеется база данных MySQL, в которой сохранены порядка 2.9 миллионов капч и правильных ответов к ним. База данных должна быть использована для обучения модели 3)Технология: -Предпочтительный язык программирования: Python. -Ожидается, что решение будет основано на обучении нейронной сети с использованием предоставленного набора данных. 4)Интеграция: -Разработанная система должна быть доступна через API. -Вход: изображение капчи (формат JPEG/PNG). -Выход: текст, соответствующий капче.
5)Производительность: -Необходимо обеспечить возможность работы в 20 потоков одновременно, с возможностью дальнейшего увеличения числа потоков. -Система должна быть адаптируема для горизонтального масштабирования. 6)Инфраструктура и развертывание: -Решение должно быть развернуто в Docker-контейнере. Исполнитель должен предоставить готовый Dockerfile для сборки контейнера, а также инструкцию по развертыванию. Все необходимые зависимости и настройки должны быть включены в Dockerfile для упрощения установки и эксплуатации системы. 7)Документация и тестирование: -Исполнитель должен предоставить документацию по использованию и настройке системы. -Необходимо провести тестирование модели на реальных данных и предоставить отчеты о точности и скорости работы. -Точность (accuracy): доля верно распознанных капч (не менее 90%) -Среднее время обработки капчи: время от передачи изображения до получения текста (не более 8 сек) -Процент ошибок (ошибочно распознанные капчи).
Исполнитель может предложить улучшения в архитектуре или подходе к решению задачи, если они помогут повысить точность распознавания или улучшить производительность.