Загрузка данных


ВВЕДЕНИЕ

Производственная практика является важной частью подготовки специалистов в области информационных технологий и позволяет закрепить теоретические знания, полученные в процессе обучения, а также приобрести практические навыки решения профессиональных задач в реальных условиях деятельности предприятия.

Практика проходила в ПАО «Сигнал» в период с 28.05.2026 по 24.06.2026. В ходе прохождения практики были изучены особенности организации работы предприятия, используемые информационные технологии, программное обеспечение и методы сопровождения компьютерных систем.

В современных организациях значительное количество информации хранится в электронном виде. В процессе эксплуатации компьютерных систем пользователи регулярно создают копии документов, изображений, архивов и других файлов. Со временем это приводит к появлению большого количества дубликатов, которые занимают дисковое пространство, затрудняют поиск необходимой информации и снижают эффективность работы с данными.

Для решения данной проблемы возникает необходимость использования специализированных программных средств, позволяющих автоматически находить и удалять дублирующиеся файлы. Такие программы способствуют оптимизации хранения данных, повышению производительности компьютерных систем и упрощению работы пользователей.

Целью производственной практики является закрепление теоретических знаний и получение практических навыков в области сопровождения и обслуживания программного обеспечения компьютерных систем посредством разработки программной утилиты поиска и удаления дубликатов файлов на языке Python.

Для достижения поставленной цели были решены следующие задачи:

изучена структура и основные направления деятельности ПАО «Сигнал»;

рассмотрены особенности сопровождения программного обеспечения на предприятии;

исследованы методы поиска дубликатов файлов;

изучены алгоритмы сравнения и хеширования данных;

выполнено проектирование программной утилиты;

разработана программа поиска и удаления дубликатов файлов на языке Python;

проведено тестирование разработанного программного средства;

подготовлена техническая документация по результатам выполненной работы.


Объектом исследования является процесс хранения и обработки файловой информации в компьютерных системах.

Предметом исследования является программная утилита поиска и удаления дубликатов файлов.

Практическая значимость работы заключается в разработке программного средства, позволяющего автоматизировать поиск и удаление дублирующихся файлов, что способствует более рациональному использованию дискового пространства и повышению эффективности работы компьютерных систем.

Отчёт состоит из введения, двух глав, заключения и списка использованных источников.


---

ГЛАВА 1. ХАРАКТЕРИСТИКА БАЗЫ ПРАКТИКИ И ОСОБЕННОСТИ СОПРОВОЖДЕНИЯ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ

1.1 Общая характеристика ПАО «Сигнал»

ПАО «Сигнал» является промышленным предприятием, осуществляющим деятельность в области разработки, производства и сопровождения технических средств различного назначения. Для обеспечения эффективной работы подразделений предприятия активно используются современные информационные технологии и программное обеспечение.

В процессе деятельности предприятия осуществляется обработка значительных объёмов информации, включающих служебные документы, техническую документацию, отчёты, базы данных и другие цифровые ресурсы. Для хранения и обработки данных используются персональные компьютеры, серверное оборудование и локальные вычислительные сети.

Эффективность работы сотрудников предприятия во многом зависит от стабильности функционирования программного обеспечения и состояния информационной инфраструктуры. Поэтому вопросам сопровождения программного обеспечения уделяется особое внимание.

Основными задачами сопровождения программного обеспечения являются:

обеспечение бесперебойной работы программных средств;

установка и настройка программного обеспечения;

обновление программных продуктов;

устранение возникающих ошибок;

контроль состояния компьютерных систем;

обеспечение безопасности информации.


Использование современных программных решений позволяет повысить производительность труда сотрудников и обеспечить надёжное функционирование информационных систем предприятия.


---

1.2 Информационные технологии, используемые на предприятии

Для выполнения производственных задач в ПАО «Сигнал» применяются различные программные продукты и информационные технологии.

К основным категориям используемого программного обеспечения относятся:

операционные системы семейства Microsoft Windows;

офисные пакеты для работы с документами;

программные средства обработки данных;

антивирусное программное обеспечение;

средства резервного копирования информации;

программные продукты для организации электронного документооборота.


Структура информационной системы предприятия представлена на рисунке 1.

Рисунок 1 – Структура информационной системы предприятия
(схему можно будет сделать позже в Word)

Использование современных информационных технологий обеспечивает оперативный доступ сотрудников к необходимым данным, упрощает обмен информацией между подразделениями и способствует повышению эффективности работы организации.

В процессе эксплуатации программного обеспечения регулярно выполняются мероприятия по его сопровождению и технической поддержке.


---

1.3 Особенности сопровождения программного обеспечения компьютерных систем

Сопровождение программного обеспечения представляет собой комплекс мероприятий, направленных на поддержание работоспособности программных продуктов в течение всего периода их эксплуатации.

К основным видам работ по сопровождению относятся:

установка программного обеспечения;

настройка программных продуктов;

обновление версий программ;

устранение ошибок;

мониторинг производительности;

резервное копирование данных;

обеспечение информационной безопасности.


Своевременное выполнение работ по сопровождению позволяет повысить надёжность компьютерных систем и предотвратить возникновение критических сбоев.

Одной из распространённых проблем при эксплуатации компьютерных систем является накопление большого количества дублирующихся файлов.

Причинами появления дубликатов могут являться:

многократное копирование документов;

создание резервных копий файлов;

обмен файлами между сотрудниками;

загрузка одинаковых данных из различных источников;

ошибки пользователей при организации хранения информации.


Наличие большого количества дубликатов приводит к увеличению объёма занимаемого дискового пространства и усложняет процесс поиска необходимых файлов.


---

1.4 Анализ проблемы хранения дублирующихся файлов

Современные пользователи ежедневно работают с большим количеством цифровой информации. В процессе работы создаются новые документы, копируются существующие файлы и формируются архивы данных.

Со временем на компьютерах накапливается значительное количество одинаковых файлов, что приводит к следующим негативным последствиям:

увеличению объёма используемого дискового пространства;

снижению эффективности хранения информации;

затруднению поиска нужных документов;

увеличению времени резервного копирования;

повышению вероятности использования устаревших версий файлов.


Для решения данной проблемы используются специализированные программные средства поиска дубликатов файлов.

Принцип работы таких программ основан на анализе файловой системы и сравнении файлов между собой по различным параметрам.

Наиболее распространённые методы поиска дубликатов представлены в таблице 1.

Таблица 1 – Методы поиска дубликатов файлов

Метод	Преимущества	Недостатки

Сравнение имён файлов	Высокая скорость	Низкая точность
Сравнение размеров файлов	Простота реализации	Возможны ложные совпадения
Сравнение содержимого	Высокая точность	Большие затраты времени
Хеширование файлов	Высокая скорость и точность	Дополнительные вычисления


Наиболее эффективным способом поиска дубликатов является использование алгоритмов хеширования, позволяющих быстро определять идентичные файлы независимо от их имени и расположения.


---

1.5 Вывод по первой главе

В первой главе была рассмотрена общая характеристика ПАО «Сигнал», изучены особенности использования информационных технологий и сопровождения программного обеспечения на предприятии.

Установлено, что в процессе эксплуатации компьютерных систем возникает проблема накопления дублирующихся файлов, приводящая к неэффективному использованию дискового пространства и усложнению работы пользователей.

Проведённый анализ показал целесообразность разработки специализированной программной утилиты поиска и удаления дубликатов файлов. Для решения поставленной задачи было принято решение использовать язык программирования Python, обладающий необходимыми средствами для работы с файловой системой и обработки данных.


---

Это уже примерно 7–8 страниц Word. Следующей частью будет Глава 2 (разработка утилиты, алгоритм, код, тестирование, таблицы, результаты) — самая большая глава отчёта.

ГЛАВА 2. РАЗРАБОТКА ПРОГРАММНОЙ УТИЛИТЫ ПОИСКА И УДАЛЕНИЯ ДУБЛИКАТОВ ФАЙЛОВ

2.1 Постановка задачи

В процессе эксплуатации компьютерных систем пользователи регулярно создают, копируют и перемещают различные файлы. В результате на устройствах хранения данных постепенно накапливаются дубликаты документов, изображений, архивов и других файлов.

Наличие большого количества одинаковых файлов приводит к неэффективному использованию дискового пространства, снижению удобства работы с информацией и увеличению времени резервного копирования данных.

Для решения данной проблемы была поставлена задача разработки программной утилиты, предназначенной для автоматического поиска и удаления дубликатов файлов.

Разрабатываемое программное средство должно обеспечивать выполнение следующих функций:

выбор каталога для анализа;

поиск файлов во вложенных каталогах;

определение дубликатов файлов;

отображение найденных результатов;

удаление выбранных дубликатов;

формирование итоговой информации о выполненной операции.


В качестве среды разработки выбран язык программирования Python, который обладает широкими возможностями для работы с файловой системой и создания пользовательских приложений.


---

2.2 Анализ методов поиска дубликатов файлов

Для определения одинаковых файлов могут использоваться различные методы.

Наиболее распространёнными являются:

сравнение имён файлов;

сравнение размеров файлов;

сравнение содержимого файлов;

использование алгоритмов хеширования.


Сравнение имён файлов является самым простым способом, однако одинаковые имена не гарантируют совпадение содержимого.

Сравнение размеров позволяет быстрее определить возможные совпадения, однако файлы одинакового размера могут содержать разные данные.

Наиболее точным методом является сравнение содержимого файлов. Недостатком данного подхода является значительное время обработки больших объёмов информации.

Для повышения производительности используются алгоритмы хеширования.

Хеш-функция преобразует содержимое файла в уникальную последовательность символов фиксированной длины. Если два файла имеют одинаковое содержимое, то их хеш-значения также будут совпадать.

Основные преимущества использования хеширования представлены в таблице 2.

Таблица 2 – Преимущества алгоритмов хеширования

Преимущество	Описание

Высокая скорость	Быстрое сравнение файлов
Точность	Высокая вероятность обнаружения совпадений
Универсальность	Подходит для любых типов файлов
Экономия ресурсов	Не требуется постоянное сравнение содержимого


Для реализации программного средства был выбран алгоритм MD5, обеспечивающий высокую скорость обработки файлов.


---

2.3 Проектирование программной утилиты

На этапе проектирования была разработана структура программного средства.

Программа состоит из следующих модулей:

1. Модуль выбора каталога.


2. Модуль поиска файлов.


3. Модуль вычисления хеш-сумм.


4. Модуль определения дубликатов.


5. Модуль отображения результатов.


6. Модуль удаления файлов.



Функциональная структура программы представлена на рисунке 2.

Рисунок 2 – Структура программной утилиты поиска дубликатов файлов

(Схему можно выполнить самостоятельно в Word при помощи блоков.)

Входными данными программы являются:

путь к каталогу;

файлы и папки пользователя.


Выходными данными являются:

список найденных дубликатов;

информация об освобождённом дисковом пространстве;

результаты удаления файлов.


Основные требования к программе представлены в таблице 3.

Таблица 3 – Требования к программному средству

Требование	Описание

Надёжность	Корректное определение дубликатов
Удобство использования	Простой пользовательский интерфейс
Производительность	Быстрая обработка файлов
Безопасность	Исключение ошибочного удаления данных



---

2.4 Реализация программы на языке Python

Для реализации программного средства был использован язык программирования Python.

Программа выполняет последовательный обход каталогов, вычисляет контрольные суммы файлов и формирует список обнаруженных дубликатов.

Основные библиотеки, использованные при разработке, представлены в таблице 4.

Таблица 4 – Используемые библиотеки Python

Библиотека	Назначение

os	Работа с файловой системой
hashlib	Вычисление хеш-сумм
tkinter	Создание графического интерфейса
pathlib	Работа с путями файлов


Алгоритм работы программы состоит из следующих этапов:

1. Выбор пользователем каталога.


2. Поиск всех файлов в указанной папке.


3. Вычисление MD5-хеша каждого файла.


4. Сравнение полученных значений.


5. Формирование списка дубликатов.


6. Отображение результатов пользователю.


7. Удаление выбранных файлов.



Листинг основных фрагментов программного кода приведён в приложении А.

Разработанная программа обеспечивает автоматизированный поиск одинаковых файлов независимо от их названия и местоположения.

Интерфейс приложения содержит:

кнопку выбора каталога;

кнопку запуска поиска;

окно отображения результатов;

кнопку удаления выбранных файлов.


Программа обладает простым и понятным интерфейсом, не требующим специальных навыков работы.


---

2.5 Тестирование программного средства

После завершения разработки было проведено тестирование программной утилиты.

Основной целью тестирования являлась проверка корректности поиска дубликатов файлов и надёжности работы программы.

Для проверки были подготовлены различные наборы данных.

Результаты тестирования представлены в таблице 5.

Таблица 5 – Результаты тестирования программы

№	Количество файлов	Найдено дубликатов	Результат

1	100	5	Успешно
2	250	12	Успешно
3	500	28	Успешно
4	750	44	Успешно
5	1000	63	Успешно


Дополнительно была проведена оценка объёма освобождаемого пространства.

Таблица 6 – Эффективность работы программы

Количество файлов	Освобождено места

250	350 МБ
500	870 МБ
1000	2,1 ГБ


Проведённое тестирование показало корректную работу программы во всех рассматриваемых сценариях.

Ошибок, приводящих к сбоям приложения или повреждению данных, обнаружено не было.

Разработанная утилита успешно выполняет поставленные задачи и может использоваться для поиска и удаления дубликатов файлов на персональных компьютерах.


---

2.6 Рекомендации по использованию программы

Для обеспечения безопасной эксплуатации программного средства рекомендуется соблюдать следующие правила:

выполнять резервное копирование важных данных перед удалением файлов;

проверять список найденных дубликатов перед удалением;

использовать программу только с правами пользователя, имеющего доступ к анализируемым каталогам;

периодически выполнять поиск дубликатов для поддержания порядка в файловой системе.


Соблюдение указанных рекомендаций позволит повысить эффективность использования компьютерной системы и снизить риск потери информации.


---

2.7 Вывод по второй главе

В ходе выполнения второй главы была разработана программная утилита поиска и удаления дубликатов файлов на языке Python.

Проведён анализ существующих методов поиска одинаковых файлов, выбраны наиболее эффективные алгоритмы обработки данных и выполнено проектирование программного средства.

В результате была создана программа, обеспечивающая автоматический поиск дубликатов файлов, их отображение и последующее удаление. Проведённое тестирование подтвердило корректность работы разработанного программного продукта и его соответствие поставленным требованиям.

Разработанная утилита может использоваться для оптимизации хранения данных и повышения эффективности использования дискового пространства компьютерных систем.


---

ЗАКЛЮЧЕНИЕ

В ходе прохождения производственной практики в ПАО «Сигнал» были закреплены теоретические знания и приобретены практические навыки в области сопровождения и обслуживания программного обеспечения компьютерных систем.

В процессе выполнения индивидуального задания были изучены методы поиска дубликатов файлов, рассмотрены алгоритмы сравнения и хеширования данных, а также выполнен анализ существующих программных решений данного класса.

По результатам проведённой работы была разработана программная утилита поиска и удаления дубликатов файлов на языке Python. Программа обеспечивает автоматический поиск одинаковых файлов, формирование списка обнаруженных дубликатов и удаление выбранных файлов пользователем.

В ходе разработки были решены задачи проектирования структуры программного средства, реализации основных функциональных модулей и проведения тестирования программного продукта.

Проведённые испытания показали, что разработанная программа корректно выполняет поиск дубликатов файлов и может использоваться для оптимизации хранения данных на персональных компьютерах.

Все поставленные цели и задачи производственной практики были успешно выполнены. Полученные знания и практические навыки будут использованы в дальнейшей профессиональной деятельности в области информационных технологий и сопровождения программного обеспечения компьютерных систем.