Ты работаешь в текущей папке проекта.
/home/work/skil-scrap
Задача:
Создать безопасный начальный каркас skill-а для выгрузки META в Markdown.
Название проекта:
adt-markdownify-meta
Важно:
- Работай только в текущей папке.
- Не переходи в другие директории.
- Не изменяй чужие проекты.
- Не используй API META.
- Не придумывай endpoint-ы META.
- Не добавляй token, cookie, login, password.
- Не используй requests, httpx, aiohttp, urllib.
- Сейчас нужно выполнить только простые подготовительные действия: создать структуру проекта и базовые конфигурационные файлы.
Создай в текущей папке структуру:
adt-markdownify-meta/
README.md
SKILL.md
meta_exporter.yaml.example
meta_urls.txt
requirements.txt
run_exporter.py
scripts/
config_loader.py
scrape_meta.py
html_to_markdown.py
markdown_writer.py
output/
temp_html/
После создания заполни только эти файлы:
1. requirements.txt
2. meta_exporter.yaml.example
3. meta_urls.txt
4. README.md
5. SKILL.md
Остальные Python-файлы пока оставь пустыми или с коротким комментарием-заглушкой.
Содержимое requirements.txt:
playwright
pyyaml
beautifulsoup4
html2text
Содержимое meta_exporter.yaml.example:
# Пути
meta_urls_file: "meta_urls.txt"
output_dir: "output"
temp_html_dir: "temp_html"
# Браузер
browser:
type: "chromium" # chromium или sberbrowser
path_to_exe: ""
# Настройки браузера
browser_settings:
headless: false
slow_mo: 1000
viewport_width: 1920
viewport_height: 1080
wait_until: "networkidle"
page_load_timeout: 60000
# Настройки скрапинга
scraping:
max_retries: 3
retry_delay: 2
request_delay: 1
# META
meta:
manual_login: true
save_raw_html: true
convert_to_markdown: true
Содержимое meta_urls.txt:
СберНаЛадони - https://mapp.sberbank.ru/techcookbook-meta
README.md должен кратко описывать:
- что проект выгружает страницы META в Markdown;
- что используется браузерный скраппинг через Playwright;
- что API META не используется;
- как установить зависимости;
- как скопировать конфиг;
- как запустить проект;
- где будут результаты.
SKILL.md должен кратко описывать:
- цель skill-а;
- что нужно выгружать из META:
1. Иерархия АС > ФП > Модуль > Подмодуль > ТК
2. Точки взаимодействия + API
3. Интеграционные взаимодействия + API
4. Стенды
5. Технические ресурсы
- ограничения:
- не придумывать данные;
- не использовать API;
- не хранить токены/cookie/логины/пароли;
- если данные не найдены, писать "Не найдено".
После выполнения покажи:
1. команду pwd;
2. дерево проекта командой:
find adt-markdownify-meta -maxdepth 3 -print
3. содержимое файлов:
- adt-markdownify-meta/requirements.txt
- adt-markdownify-meta/meta_exporter.yaml.example
- adt-markdownify-meta/meta_urls.txt
- adt-markdownify-meta/README.md
- adt-markdownify-meta/SKILL.md