Задача: - Есть пул сторонних телеграм чатов-доноров, откуда будут собираться сообщения - Есть несколько списков с ключевыми словами (к примеру - 2шт) - И есть столько же технических групп телеграм (2шт)
Нужно выстроить систему при, которой сообщения из чатов-доноров постоянно собираются (teleton или pyrogram) и проверяются на наличие в них ключевых слов из каждого списка. При наличии ключевых слов сообщении - оно отправляется в соответствующую техническую группу телеграм (одну или несколько, в зависимости от того из скольких списков найдены ключевые слова). Возможно - заменить группу на файл в бд, если так "безопаснее" работать с точки зрения блокировок.
С чем нужно помочь разобраться: 1. Какие методы библиотек использовать лучше всего в данном случае и почему (мониторинг сообщений в чатах либо сбор через iter_messages / get_chat_history)? 2. Какая периодичность сбора сообщений из доноров должна быть в данном случае в расчете на один аккаунт/прокси, чтобы не превышать лимит и избегать бана? 3. Сколько потребуется аккаунтов/сессий телеграм и прокси, чтобы обеспечивать требуемый "объем работ" парсера? 4. Как происходит процесс инициализации аккаунтов (ввод кода подтверждения в терминале)? Или для этих целей покупаются сразу файлы сессий? 5. Как и в каких случаях происходит процесс смены аккаунта/прокси в процессе работы программы? 6. Какой регион сессий и прокси предпочтительнее (для работы по РФ), на какой площадке их лучше приобретать? 7. Как поддерживать работу программы (как часто придется приобретать доп прокси и сессии для работы и придется ли если грамотно выстроить частоту запросов программы)
В процессе консультации нужно будет привести примеры кода того как должен выглядеть процесс работы с сессиями и прокси.
P.S: Какие-то вопросы могут пересекаться - описал так, как понимаю на данный момент.