1001 Freelance Projects -- Разработать crawler для сайта производителя (для всех)

Свежие проекты с фриланс-бирж

Сегодня: 26-Jun-2026 19:40 GMT

Подробный просмотр проекта (вы будете перенаправлены на сторонний сайт)
Название проекта:	Разработать crawler для сайта производителя (для всех)
Кто разместил:	Внешний проект с free-lance.ru
Открыт:	30-Apr-2026 14:05 GMT
Описание:	Необходимо собрать в БД всю публичную информацию по системе управления котельной. Информация может включать в себя инструкции по настройке, документацию и спецификации, карточки товаров, инструкции по устранению ошибок, кейсы использования и другие маркетинговые материалы, отзывы клиентов и т.д. Задача кажется довольно объемной, поэтому хотел бы решать ее по этапам с оплатой по этапам, но если сработаемся хотел бы это делать с одним человеком весь проект. В рамках данного заказа предполагается выполнение только первого этапа. Этап 1. Парсинг официального сайта, включая библиотеку документации (она на отдельном домене). Необходимо распарсить всю текстовую информацию содержащуюся на страницах и записать ее в БД в структурированном виде. Причем действовать нужно рекурсивно, т.е. переходить по вложенным ссылкам, если они ссылаются на официальный домен. Парсить нужно только информацию находящуюся на страницах, на этом этапе парсить видео или PDF документы не требуется. БД должна содержать следующую информацию: - URL-ссылка на исходник страницы - Спаршеный текст (собственно данные). Описание ниже. - тип (страница, PDF, видео и т.д.) - заголовок страницы Что нужно от самих данных/статей/документов, которые мы парсим и сохраняем как информацию. Требуется сохранить разметку: - заголовки с сохранением уровнем заголовка - списки - таблицы - ссылки - разделение параграфов - картинки или другой медиа-контент (ссылками на исходник) Для выполнения задачи могут быть предложены уже готовые проекты crawler в том числе с оплатой за $, если это может упростить задачу. Следующим этапом будет являться чанкинг и программирование RAG системы, но это в рамках следующих заказов. Языки программирования: Phyton или PHP. Для парсинга может быть подобран готовый инструмент по согласованию. Также может быть использован по согласованию фреймворк вроде LangChain.
Project ID:	4836523
Категория проекта:	Программирование, Python
Бюджет проекта:

Подробный просмотр проекта (вы будете перенаправлены на сторонний сайт)

Проект	Открыт
Создание лендинга на WordPress Категория: Сайты, Сайт «под ключ»	10-Jun-2026 10:05 GMT
Подключить к сайту Яндекс.Метрику Категория: Сайты, Доработка сайтов Бюджет: 500 руб	10-Jun-2026 10:05 GMT
Сбор базы франшиз (Косметология и Лазерная эпиляция) Категория: Программирование, Парсинг данных	10-Jun-2026 10:03 GMT
Разработать брендбук для медиа Категория: Фирменный стиль, Брендбук	10-Jun-2026 09:48 GMT
сайт строительной компании для сбора заявок Категория: Сайты, Сайт «под ключ»	10-Jun-2026 09:46 GMT
Создание имиджевого интро-видео Категория: Аудио/Видео/Фото, Видеомонтаж	10-Jun-2026 09:46 GMT
SEO-продвижение сайта Категория: Продвижение сайтов (SEO, GEO), Продвижение сайтов SEO	10-Jun-2026 09:46 GMT
Разместить позитивный отзыв на магазин в интернете. Категория: Тексты, Постинг Бюджет: 70 руб	10-Jun-2026 09:36 GMT
Инфографика на фото Категория: Дизайн, Инфографика Бюджет: 2 500 руб	10-Jun-2026 09:36 GMT
Диплом + презентация + речь — учёт лекарств в аптеке (Python/Flask) Категория: Тексты, Тексты/Речи/Рапорты Бюджет: 7 000 руб	10-Jun-2026 09:36 GMT
Написание текстов под ИИ Категория: Тексты, Копирайтинг	10-Jun-2026 09:29 GMT
Провести SEO-оптимизацию сайта перед запуском Категория: Продвижение сайтов (SEO, GEO), Аудит сайта	10-Jun-2026 09:27 GMT
Сбор данных из выдачи гугла в гуглдок таблицу + анализ Категория: Программирование, Парсинг данных	10-Jun-2026 09:21 GMT
Нужно сделать монтаж видео-Reels Категория: Аудио/Видео/Фото, Видеомонтаж Бюджет: 300 руб	10-Jun-2026 09:21 GMT
Оформление презентаций в фирменном стиле Категория: Дизайн, Презентации Бюджет: 2 000 руб	10-Jun-2026 09:20 GMT

Все проекты

Проекты по навыкам ...
Проекты 'android' Проекты 'ajax' Проекты 'asp' Проекты 'aspnet' Проекты 'cms' Проекты 'cpp' Проекты 'csharp' Проекты 'css' Проекты 'delphi' Проекты 'design' Проекты 'drupal' Проекты 'excel'	Проекты 'facebook' Проекты 'flash' Проекты 'html' Проекты 'java' Проекты 'javascript' Проекты 'joomla' Проекты 'iphone' Проекты 'mysql' Проекты 'photoshop' Проекты 'php' Проекты 'python' Проекты 'ruby' Проекты 'seo'	Проекты 'sql' Проекты 'sysadm' Проекты 'translate' Проекты 'typing' Проекты 'twitter' Проекты 'vbnet' Проекты 'xml' Проекты 'wordpress' Проекты 'writing' Проекты 'texts'
Читать RSS-ленты ... Новое!
Проекты 'android' Проекты 'ajax' Проекты 'asp' Проекты 'aspnet' Проекты 'cms' Проекты 'cpp' Проекты 'csharp' Проекты 'css' Проекты 'delphi' Проекты 'design' Проекты 'drupal' Проекты 'excel'	Проекты 'facebook' Проекты 'flash' Проекты 'html' Проекты 'java' Проекты 'javascript' Проекты 'joomla' Проекты 'iphone' Проекты 'mysql' Проекты 'photoshop' Проекты 'php' Проекты 'python' Проекты 'ruby' Проекты 'seo'	Проекты 'sql' Проекты 'sysadm' Проекты 'translate' Проекты 'typing' Проекты 'twitter' Проекты 'vbnet' Проекты 'xml' Проекты 'wordpress' Проекты 'writing' Проекты 'texts'

Новое!
Projects in English	Длинный URL: www.1001freelanceprojects.ru	Мобильная версия: m.1001fp.ru