Загрузка данных


Ты работаешь в проекте:

/home/sigma.sbrf.ru@23865613/home/work/skil-scrap/adt-markdownify-meta

Контекст:
Мы доработали проект по аналогии с hr-resume-scrapper:
- добавили browser_settings.args;
- указали SberBrowser path_to_exe;
- изменили wait_until на domcontentloaded;
- доработали launch_browser.

Сейчас НЕ нужно запускать полный scraping.
Сейчас НЕ нужно открывать META.
Сейчас НЕ нужно скачивать зависимости заново.
Сейчас нужно только проверить файлы и импорты настолько, насколько возможно.

Важно:
- Не меняй код.
- Не меняй конфиги.
- Не запускай python run_exporter.py.
- Не запускай полный сбор.
- Если на каком-то шаге ошибка — остановись и покажи:
  1. номер шага;
  2. команду;
  3. полный текст ошибки;
  4. краткое объяснение.

Шаг 1. Перейти в проект

cd /home/sigma.sbrf.ru@23865613/home/work/skil-scrap/adt-markdownify-meta
pwd

Шаг 2. Проверить, что нужные файлы есть

ls -la meta_exporter.yaml.example scripts/scrape_meta.py

Шаг 3. Показать актуальный конфиг

cat meta_exporter.yaml.example

Проверь, что там есть:

browser:
  type: "sberbrowser"
  path_to_exe: "/opt/Sberbrowser/sberbrowser/sberbrowser"

browser_settings:
  wait_until: "domcontentloaded"
  args:
    - "--no-sandbox"
    - "--disable-setuid-sandbox"
    - "--disable-dev-shm-usage"

Если этого нет — остановись и напиши, чего не хватает.

Шаг 4. Проверить путь к SberBrowser

ls -la /opt/Sberbrowser/sberbrowser/sberbrowser

Если файла нет — остановись и покажи ошибку.

Шаг 5. Проверить синтаксис Python-файлов без запуска проекта

Выполни:

python3 -m py_compile run_exporter.py scripts/config_loader.py scripts/scrape_meta.py scripts/html_to_markdown.py scripts/markdown_writer.py

Если есть синтаксическая ошибка — остановись и покажи её.

Шаг 6. Проверить, есть ли установленный PyYAML

python3 -c "import yaml; print('yaml ok')"

Если yaml не установлен — не пытайся устанавливать. Просто напиши, что для чтения конфига нужен PyYAML.

Шаг 7. Если yaml установлен, проверить чтение example-конфига напрямую

python3 -c "import yaml; from pathlib import Path; data=yaml.safe_load(Path('meta_exporter.yaml.example').read_text(encoding='utf-8')); print(data['browser']); print(data['browser_settings'])"

Если команда упала — остановись и покажи ошибку.

Шаг 8. Проверить, установлен ли playwright

python3 -c "import playwright; print('playwright ok')"

Если playwright не установлен — не пытайся устанавливать. Просто напиши:
"Playwright не установлен, поэтому браузерный запуск пока невозможен. Код и конфиг подготовлены, но для запуска нужен установленный playwright."

Шаг 9. Итоговый отчёт

Напиши краткий отчёт:
1. Конфиг обновлён или нет.
2. SberBrowser найден или нет.
3. Python-синтаксис файлов корректный или нет.
4. PyYAML установлен или нет.
5. Playwright установлен или нет.
6. Можно ли переходить к запуску браузера или сначала нужно решить установку playwright.