Загрузка данных


from docx import Document
from pathlib import Path

# Что заменять
REPLACEMENTS = {
    "Иванов Иван Иванович": "[ФИО]",
    "ООО Ромашка": "[ОРГАНИЗАЦИЯ]",
    "+7 999 123-45-67": "[ТЕЛЕФОН]",
    "test@mail.ru": "[EMAIL]"
}

# Папка со скриптом
folder = Path(__file__).parent

for file_path in folder.glob("*.docx"):

    # Пропускаем уже обработанные файлы
    if "_anon" in file_path.stem:
        continue

    print(f"Обработка: {file_path.name}")

    doc = Document(file_path)

    # Абзацы
    for paragraph in doc.paragraphs:
        for old, new in REPLACEMENTS.items():
            if old in paragraph.text:
                paragraph.text = paragraph.text.replace(old, new)

    # Таблицы
    for table in doc.tables:
        for row in table.rows:
            for cell in row.cells:
                for old, new in REPLACEMENTS.items():
                    if old in cell.text:
                        cell.text = cell.text.replace(old, new)

    # Сохраняем копию
    new_name = file_path.with_name(f"{file_path.stem}_anon.docx")
    doc.save(new_name)

print("Готово.")