Ты работаешь в проекте:
/home/sigma.sbrf.ru@23865613/home/work/skil-scrap/adt-markdownify-meta
Контекст:
Мы доработали проект по аналогии с hr-resume-scrapper:
- добавили browser_settings.args;
- указали SberBrowser path_to_exe;
- изменили wait_until на domcontentloaded;
- доработали launch_browser.
Сейчас НЕ нужно запускать полный scraping.
Сейчас НЕ нужно открывать META.
Сейчас НЕ нужно скачивать зависимости заново.
Сейчас нужно только проверить файлы и импорты настолько, насколько возможно.
Важно:
- Не меняй код.
- Не меняй конфиги.
- Не запускай python run_exporter.py.
- Не запускай полный сбор.
- Если на каком-то шаге ошибка — остановись и покажи:
1. номер шага;
2. команду;
3. полный текст ошибки;
4. краткое объяснение.
Шаг 1. Перейти в проект
cd /home/sigma.sbrf.ru@23865613/home/work/skil-scrap/adt-markdownify-meta
pwd
Шаг 2. Проверить, что нужные файлы есть
ls -la meta_exporter.yaml.example scripts/scrape_meta.py
Шаг 3. Показать актуальный конфиг
cat meta_exporter.yaml.example
Проверь, что там есть:
browser:
type: "sberbrowser"
path_to_exe: "/opt/Sberbrowser/sberbrowser/sberbrowser"
browser_settings:
wait_until: "domcontentloaded"
args:
- "--no-sandbox"
- "--disable-setuid-sandbox"
- "--disable-dev-shm-usage"
Если этого нет — остановись и напиши, чего не хватает.
Шаг 4. Проверить путь к SberBrowser
ls -la /opt/Sberbrowser/sberbrowser/sberbrowser
Если файла нет — остановись и покажи ошибку.
Шаг 5. Проверить синтаксис Python-файлов без запуска проекта
Выполни:
python3 -m py_compile run_exporter.py scripts/config_loader.py scripts/scrape_meta.py scripts/html_to_markdown.py scripts/markdown_writer.py
Если есть синтаксическая ошибка — остановись и покажи её.
Шаг 6. Проверить, есть ли установленный PyYAML
python3 -c "import yaml; print('yaml ok')"
Если yaml не установлен — не пытайся устанавливать. Просто напиши, что для чтения конфига нужен PyYAML.
Шаг 7. Если yaml установлен, проверить чтение example-конфига напрямую
python3 -c "import yaml; from pathlib import Path; data=yaml.safe_load(Path('meta_exporter.yaml.example').read_text(encoding='utf-8')); print(data['browser']); print(data['browser_settings'])"
Если команда упала — остановись и покажи ошибку.
Шаг 8. Проверить, установлен ли playwright
python3 -c "import playwright; print('playwright ok')"
Если playwright не установлен — не пытайся устанавливать. Просто напиши:
"Playwright не установлен, поэтому браузерный запуск пока невозможен. Код и конфиг подготовлены, но для запуска нужен установленный playwright."
Шаг 9. Итоговый отчёт
Напиши краткий отчёт:
1. Конфиг обновлён или нет.
2. SberBrowser найден или нет.
3. Python-синтаксис файлов корректный или нет.
4. PyYAML установлен или нет.
5. Playwright установлен или нет.
6. Можно ли переходить к запуску браузера или сначала нужно решить установку playwright.