Загрузка данных


ПЦР фрагментов мтДНК проводили с использованием набора реагентов, совместимого с ДНК-полимеразой HS Taq (Евроген, Россия) на амплификаторах Veriti и SimpliAmp (Thermo Fisher Scientific, США) в 20 мкл реакционной смеси согласно следующему протоколу: денатурация в течение 5 мин при 95 °C, затем 35 циклов: 95 °C в течение 30 с, 1 мин отжига праймеров при специфичной для каждой пары температуре (таблица 4), элонгация в течение 90 с при 72 °C, далее финальная элонгация при 72 °C в течение 5 мин. Для проверки качества полученных ПЦР-продуктов визуализировали их с помощью горизонтального электрофореза, окрашивая бромистым этидием в 2%-ном агарозном геле. 
В рамках пробоподготовки ПЦР-продукта к секвенированию по Сэнгеру: 
•	очищали его классическим методом осаждения ДНК этанолом (EtOH, финальная концентрация 69-71%) с ацетатом аммония (NH4Ac, финальная концентрация 0,125 M);
•	для надежного прочтения (в направлениях 5′→3′ и 3′→5′) амплифицированных фрагментов к очищенной матрице добавляли оба праймера (3,2 – 5 пмоль/мкл) – либо прямой, либо обратный на лунку;   
•	затем проводили реакцию секвенирования в соответствии с протоколом производителя, используя набор реагентов BigDye Terminator v3.1 Cycle Sequencing Kit (Thermo Fisher Scientific, США);
•	после завершения реакции, полученные продукты вновь очищали с помощью описанного выше метода (EtOH + NH4Ac). 
Капиллярный электрофорез очищенных таким образом продуктов секвенирования проводили с помощью генетического анализатора 3500 Genetic Analyzer (Applied Biosystems, Thermo Fisher Scientific, США). Описанная экспериментальная работа проводилась в Центре коллективного пользования «Группа геномных технологий» (ЦКП «ГГТ») ИБР РАН.  
2.3.4 Подготовка библиотек в рамках полногеномного подхода
Полногеномный подход был реализован с помощью секвенирования ДНК, ассоциированного с сайтами рестрикции (RADseq) (Baird, et al., 2008; Andrews et al., 2016). Для этого была использована рестрикционная эндонуклеаза II типа (type-II restriction enzyme) SbfI-HF (New England Biolabs, США) и система двойных генетических штрихкодов (double index barcoding) в сочетании со встроенными штрихкодами (inline barcodes). Последние содержались в последовательностях различных модифицированных адаптеров (P1 и P2), лигированных на липкие концы (sticky ends). 
Для анализа использовалось 210 нг высококачественной геномной ДНК (высокой степени очистки и целостности). После обработки ДНК образцов рестриктазой согласно протоколу производителя и лигирования P1-адапторами, была проведена их фрагментация ультразвуком с использованием соникатора Bioraptor Pico (Diagenode SA., Бельгия). Полученные фрагменты ДНК были разделены по размеру с использованием набора магнитных частиц SPRI Select Beads Kit (Beckman Coulter Inc., США). Затем было проведено «затупление концов» (blunting) и поли-А (poly-A) лигирование с последующим лигированием P2-адапторов на случайно разорванные концы ДНК с использованием T4 ДНК-лигазы (New England Biolabs, США). Полученные библиотеки каждого из образцов были объединены эквимолярно (с соблюдением равной молярной концентрации), после чего прошли двусторонний отбор по размеру с использованием набора магнитных частиц SPRI Select Beads Kit (Beckman Coulter Inc., США). 
Амплификация (14 циклов) полученных фрагментов ДНК была проведена в восьми аликвотах (по 50 мкл) с использованием High-Fidelity PCR Master Mix with HF Buffer (New England Biolabs, США). Данные аликвоты ПЦР-продуктов были объединены, после чего прошли окончательный двусторонний отбор по размеру с использованием магнитных частиц SPRI Select Beads Kit (Beckman Coulter Inc., США). 
Готовая библиотека была проверена с помощью биоанализатора Bioanalyzer (Agilent Technologies Inc, США). После финальной проверки она была секвенирована (парноконцевые прочтения длиной 150 п.н.) на платформе Illumina HiSeq в компании Novogene (Китай).
2.4. Статистическая и биоинформатическая обработка генетических данных
В рамках обработки и интерпретации генетических данных во многих из проведенных анализов были использованы общедоступные данные (NCBI, PDB) как для балобана и кречета, так и внешних по отношению к ним видов. К последним относятся, в первую очередь, сестринский вид – сапсан F. peregrinus и базальный таксон группы Hierofalco – ланнер F. biarmicus. Об использовании данных, опубликованных другими исследователями, будет указано непосредственно при описании конкретного анализа. 
Для разных этапов анализа митохондриальной и микросателлитной изменчивости было использовано следующее программное обеспечение:
1.	SeqMan v11.2.1 (DNASTAR, США) – сбор, визуальная проверка на наличие ошибок и при необходимости редактирование последовательностей, полученных в результате секвенирования по Сэнгеру;
2.	Онлайн-инструмент BLAST (Altschul et al., 1990) на портале Национального центра биотехнологической информации (NCBI) – проверка являются ли последовательности истинно митохондриальными;  
3.	MEGA X v10.1.7 (Kumar et al., 2018) – выравнивание полученных последовательностей вручную, определение гаплотипической принадлежности образцов, определение аминокислотных последовательностей, расчет частот несинонимичных замен нуклеотидов к синонимичным (dN/dS), расчет филогенетической топологии методом максимального правдоподобия (maximum likelihood, ML) с использованием модели Тамура–Нея с дискретным гамма-распределением (+G) и метода бутстрэп (1000 выборок);  
4.	DnaSP v6.12.03 (Rozas et al., 2017) – анализ изменчивости 21 фрагмента мтДНК, охватывающих полные последовательности от цитохрома b до контрольного региона;
5.	MEGA v12.0.14 (Kumar et al., 2024) – анализ изменчивости 21 фрагмента мтДНК, охватывающих полные последовательности от цитохрома b до контрольного региона, предварительная филогенетическая реконструкция методом ML с применением модели Хасегавы-Кишино-Яно (Hasegawa-Kishino-Yano, HKY) (Hasegawa et al., 1985) и адаптивного числа бутстрэп-выборок (161);
6.	PopArt v1.7 (Bandelt et al., 1999; Leigh, Bryant, 2015) – построение сети гаплотипов с исключением пробелов (gaps) и использованием модифицированного метода присоединения соседей (integer neighbor-joining method, INJ) с нулевым значением ретикуляции (reticulation);
7.	Веб-инструмент HaplowebMaker v1.0 (Spöri, Flot, 2020) – создание медианной (median-joining, MJ) сети гаплотипов с включением инделов (indels - Insertion/Deletion) в качестве 5го нуклеотида (5th state);
8.	BEAST v10.5.0 (Drummond, Rambaut, 2007; Suchard et al., 2018) с пакетом сопутствующих программ – реконструкции филогении с использованием Байесовскогобайесовского подхода;
9.	FigTree v1.4.4 (Rambaut, 2018) – визуализация филогенетических деревьев, рассчитанных сторонними программами;
10.	сервер SWISS-MODEL (Guex et al., 2009; BenkertBertoni et al., 2011; Bertoni2017; Bienert et al., 2017; Waterhouse et al., 2018; Studer et al., 2020) и программа iCn3D (на основе WebGL) (Wang et al., 2020) – моделирование белка на основе гомологии с дополнительной визуализацией; 
11.	сервер I-TASSER (Iterative Threading ASSEmbly Refinement) (Roy et al., 2010; Yang et al., 2015; Yang, Zhang, 2015) – проверка белковых взаимодействий с помощью подхода иерархического прогнозирования; 
12.	инструмент PROVEAN (Protein variation effect analyzer) (Choi, 2012; Choi et al., 2012; Choi, Chan, 2015) – предсказание функционального значения АКЗ; 
13.	TreeSAAP (Selection of amino acid properties based on phylogenetic trees) (Woolley et al., 2003) – расчет селективного влияния на структурные и биохимические свойства аминокислот в процессе филогенеза; 
14.	Micro-Checker v2.2.3 (Van Oosterhout et l., 2004) – проверка генотипов на наличие «заикания» или «статеров» (stuttering), выпадения крупных аллелей (large allele dropout) и нуль-аллелей; 
15.	Gimlet v1.3.3 (Valière, 2002) – оценка точности генотипирования и родства особей в исследуемой выборке; 
16.	STRUCTURE v2.3.4 (Pritchard et al., 2000) – Байесовскаябайесовская кластеризация на основе микросателлитных  данных; 
17.	сервер StructureSelector (Li, Liu et al.,, 2018) – определение оптимального значения K (наиболее вероятное количество кластеров в исследуемой выборке) методом, подходящим для неравновесных выборок (Puechmaille, 2016);
18.	сервер CLUMPAK (Kopelman et al., 2015) – визуализация результатов определения оптимального количества кластеров на сервере StructureSelector по результатам STRUCTURE, расчет высокого среднего показателя сходства (high mean similarity score) по результатам анализа CLUMPP (Jakobsson, Rosenberg, 2007);   
19.	Geneland v4.0.6 (Guillot et al., 2005; 2012) – Байесовскийбайесовский анализ с привлечением пространственных данных, реализованный в программной среде R 3.6.0 (2019) (R Core Team, 2025) посредством RStudio v2024.12.1.563 (Posit Team, 2025);
20.	дискриминантный анализ главных компонент (Discriminant Analysis of Principal Components, DAPC) R-пакета adegenet v2.1.10 (Jombart, 2008), реализованный в программной среде R v4.4.3 (2025) (R Core Team, 2025) с помощью RStudio v2024.12.1.563 (Posit Team, 2025), а также привлечением пакетов ggplot2 v3.5.2 (Wickham, 2016) и viridis v0.6.5 (Garnier et al., 2024) – оценка генетической кластеризации с помощью многомерного анализа;
21.	GenAlex v6.51b2 (Peakall, Smouse, 2006, 2012; Smouse et al., 2017) – расчет стандартных популяционно-генетических показателей; 
22.	HP-Rare v1.0 (Kalinowski, 2005) – расчет популяционно-генетических показателей что аллельного богатства (A') и частного аллельного богатства (Apr) с учетом минимального объема выборки, т.е. поправкой на рарефикацию.
 Необходимо отметить, что автор настоящего исследования не принимал участия в обработке подготовленных им данных (определение гаплотипической принадлежности образцов относительно данных, полученных Ф. Ниттингер с соавторами (2007)) и построении на их основе парсимониальной сети гаплотипов, представленной в работе Л.С. Зиневич с соавторами (Zinevich et al., 2023).
Для полногеномного подхода был выбран метод RADseq, что предполагает получение данных о разнообразии однонуклеотидных полиморфизмов (single nucleotide polymorphism, SNP) в геномах ислледуемых образцов (Baird, et al., 2008; Andrews et al., 2016). Пробоподготовка данных образцов к секвенированию проводилась соотвественно описанным методикам (подраздел 2.3.1 и 2.3.4). Анализ полученной базы данных предполагает наличие углубленных биоинформатических навыков работы, которыми автор диссертации не владеет. В связи с этим онАвтор не принимал участия в непосредственной биоинформатическое обработке данных RADseq, но обладает теоретическими знаниями в данном вопросе. Следовательно, ниже будет дано краткое. Ниже приведено описание ряда методик, примененных соавторами методик (Zinevich et al., 2023). 
Биоинформатическая обработка включавключала следующие этапы:
•	ВыявлениеПрочтения (около 150 п.н.), полученные на платформе Illumina HiSeq, были демультиплексированы и проверены по качеству секвенирования, после чего из них были удалены последовательности адаптеров; 
•	Подготовленные таким образом прочтения были выровнены на референсный геном балобана (GCF_000337975.1);
•	Картированные прочтения были использованы для выявления однонуклеотидных полиморфизмов (SNP calling);) с применением двух подходов: (1) отбора всех SNPs из всего набора данных и (2) отбора одного случайного SNP из каждого RAD-локуса для минимизации сцепления между ними;
•	Весь полученный набор SNPДальнейшая обработка подготовленных наборов SNPs включала фильтрацию по критерию максимальной доли пропущенных данных (20 и 10%, соответственно), наличию минорных аллелей у более чем двух особей и равновесию Харди–Вайнберга (p = 0,01) (для второго набора SNPs); 
•	Среди полученных последовательностей RAD-локусов были отобраны те, что присутствовали у всех особей, характеризовались минимальной наблюдаемой гетерозиготностью (<0,05) и содержали хотя бы один SNP (n = 422) – на их основе были созданы консенсусные последовательности;  
•	Консенсусные последовательности RAD-локусов были использолваны для выбора соответствующих им последовательностей (e-value = 1e-25) среди гомологичных участков референсных геномов внешних видов – ланнера (GCA_023638135) и сапсана (GCA_001887755);
•	Конкатенированные последовательности 431 RAD-локуса исследуемых образцов и внешних видов были использованы для построения укоренённого филогенетического древа, топология и поддержка ветвления которого были рассчитаны двумя методами: (1) максимальной парсимонии (MP) с использованием 1000 реплик непараметрического бутстрепа (non-parametric bootstrap, bs) (Felsenstein, 1985) в программе Paup v.4.0a16991 (Swofford, 2003), (2) максимального правдоподобия с оценкой надежности ветвления с помощью 1000 реплик приближенного теста отношения правдоподобия (Approximate Likelihood-Ratio Test, aLRT) (Anisimova, Gascuel, 2006) и 1000 повторов сверхбыстрого бутстрепа (ultra-fast bootstrap, UFboot), дополненного 100 псевдорепликами непарметрического бутстрепа, в программе IQ-TREE v.1.6.12 (Minh et al., 2020);
•	Полный набор из 63 566 полученных однонуклеотидных полиморфизмов от 17 особей балобана (девять из Алтае-Саянского региона, семь из Венгрии и один из Монголии) и четырех кречетов, был использован для различных филогеномных расчетов, например, построения филогенетической сети на основе метода присоединения ближайших соседей (Neighbor-Joining, NJ);построения филогенетического древа с применением метода ML с коррекцией смещения (ascertainment bias, ASC) и оценкой надежности ветвления (aLRT ≥ 80%) и (bs ≥ 75%) с помощью программы IQ-TREE v.1.6.12; 
•	Набор из 17 095 несцепленных SNP, полученных из общих данных,SNPs был использован для популяционно-геномных анализоврасчета коэффициентов индивидуального происхождения и кластеризации выборки с помощью алгоритмов факторизации неотрицательных матриц (sparse Non-negative Matrix Factorization, snmf) с использованием R-пакета LEA v.2.4.0 (Frichot, François, 2015) в программной среде R, к примеру, применения метода главных компонент (Principal Component Analysis, PCA) и DAPC; (2018) (R Core Team, 2018); 
•	Расчет генетической дифференциации исследуемых популяций, а также их основных популяционно-генетических показателей был проведен с помощью R-пакета hierfstat v. 0.04-22 (Goudet, 2005) в программной среде R (2018);
•	Полученные данныенаборы данных также были использованы: для оценки интрогрессии (Patterson’s D и FdM статистика) и направленности потока генов (FdM статистика) методом скользящего окна (100 сайтов) в отсутствие внешней группы с помощью скрипта ABBABABAwindows.py (Martin et al., 2015); для оценки интрогрессии между исследуемыми популяциями. (f3-статистика) с использованием соответствующего алгоритма (3-Population Test) в программном обеспечении AdmixTools v.7.0.2 (Patterson et al., 2012).   
ПодробноеБолее подробное описание всех использованных методологических подходов, включая процедуры и методы, представлено в оригинальной работе Л.С. Зиневич с соавторами (Zinevich et al., 2023).

 
Глава 3. Результаты
В результате проведенного исследования были получены генетические данные от 192 балобанов из пяти популяций и 30 дальневосточных кречетов (всего 222 особи) (таблица 1). 
3.1. Изменчивость митохондриальной ДНК
Последовательности, полученные в результате секвенирования по Сэнгеру включали различные фрагменты митохондриального генома балобанов и кречетов, в зависимости от целей конкретного исследования:
1.	11 фрагментов контрольного региона длиной 415 п.н. (номера в GenBank: OM937743–OM937753) для сравнения с данными, опубликованными Ф. Ниттингер с соавторами (Nittinger et al., 2007, Zinevich et al., 2023); 
2.	16 полных последовательностей гена цитохрома b длиной 1143 п.н. (номера в GenBank: MT431193–MT431208) для изучения эволюционной значимости олигонуклеотидных замен и соответствующих им физико-химических свойств аминокислот (Рожкова и др., 2021);
3.	21 фрагмент мтДНК длиной от 2595 до 2920 п.н. (номера в GenBank: PX511647–PX511667), охватывающий полные последовательности цитохрома b (1143 п.н.), тРНК-Thr (71 п.н.) и контрольного региона (≤1706 п.н.), для анализа изменчивости, филогенетических реконструкции и построения сетей гаплотипов (Rozhkova et al., 2026);
4.	35 фрагментов контрольного региона длиной от 1075 до 1299 п.н. (номера в GenBank: PX511668–PX511702) для филогенетической реконструкции байесовским методом (Rozhkova et al., 2026).    
Все полученные последовательности были проверены относительнона предмет того, являются ли они истинно митохондриальными или ядерными копиями мт-генома (NUMT) (Nacer et al., 2017). Всего для анализа изменчивости мтДНК были использованы 62 последовательности длиной от 415 до 2920 п.н.     
С целью учета всего спектра эволюционных событий – нуклеотидных замен, инсерций и делеций, вариабельности числа повторов в третьем домене – в контрольном регионе исследуемых образцов, мы модифицировали наблюдаемую в оригинальных последовательностях изменчивость (таблица П2). Полученный набор оптимизированных последовательностей был использован для ряданекоторых анализов наряду с исходными. 

3.1.1. Базовый филогенетический анализ
Короткий фрагмент контрольного региона (415 п.н.), охватывающий консервативный центральный домен, был использован для помещения наших геномных данных RADseq в сравнительный контекст.определения положения образцов, исследуемых нами в рамках полногеномного подхода, относительно известных данных о разнообразии используемого митохондриального маркера. Мы секвенировали последовательности (номера в GenBank: OM937743–OM937753, таблица П1) 11 образцов (восьми азиатских балобанов и трех кречетов). Автором настоящего исследования было проведено определение гаплотипической принадлежности образцов, включая номенклатуру гаплотипов и гаплогрупп, в контексте опубликованных данных (Nittinger et al., 2007). Полученная в результате парсимониальная сеть гаплотипов (рисунок П7П5) оказалась идентичной той, что была опубликована коллегами (Nittinger et al., 2007). Исследованные азиатские балобаны попали в обе мт-гаплогруппы, представляя гаплотипы Н1, Н66 и Н74. При этом оба «алтайских» балобана имели единый гаплотип Н1 восточной гаплогруппы. В то же время, исследованные кречеты имели единый гаплотип (Н69) группы А.    
Для тщательного изучения изменчивости мтДНК, реконструкции истории формирования мт-гаплогрупп, а также разрешения филогенетических противоречий, мы также исследовали другие фрагменты мт-генома целевых видов. Для предварительной оценки генетической дифференциации был использован 21 оригинальный фрагмент мт-генома (2595-2920 п.н.), охватывающий полные последовательности cytb, тРНК-Thr и контрольного региона, и соответствующую им последовательность внешнего вида (сапсан, NC_000878.1: 13715–16438).
Филогенетический анализ методом максимального правдоподобия показал (рисунок П8П6), что эти данные также согласуются с предыдущими исследованиями (Nittinger et al., 2007), кластеризуя балобанов (14 образцов) на две мт-гаплогруппы (А и Б, «восточную» и «западную», соответственно). Однако новым результатом стало выделение хорошо дифференцированной (97,99%) субклады кречетов (7 образцов) внутри гаплогруппы А.  
Для оценки изменчивости на уровне отдельных маркеров и видов, их изменчивости внутри и между идентифицированными кластерами, мы также провели анализ полиморфизма исходных последовательностей (таблица П3). Несмотря на сходно низкие значения средних генетических дистанций внутри клады A (0,00204 ± 0,00051) и Б (0,00201 ± 0,00052), обе гаплогруппы продемонстрировали высокое гаплотипическое разнообразие (>0,9). Средняя генетическая дистанция между изученными гаплогруппами составила 0.0108 ± 0.0018, тогда как дистанция между этими кладами и сапсаном была около 0,04. Что касается видов, наименьшее значение межгрупповой дистанции (0,0029 ± 0,0008) показано для кречета внутри клады A.

3.1.2. Сети гаплотипов
Набор из 21 выравненного фрагмента мтДНК, охватывающихпредставляющего полные последовательности от цитохрома b до контрольного регионрегиона, был использован также для построения сети гаплотипов с использованием двух различных методологических подходов: 
•	на основе оригинальных последовательностей с исключением пробелов с помощью метода INJ с нулевым значением ретикуляции;
•	на основе модифицированных последовательностей с включением инделов в качестве 5го нуклеотида с помощь алгоритма MJ (рисунок 24).

 
 
Рисунок 24. Сети гаплотипов, построенные на основе 21 исходных и модифицированных последовательностей мтДНК (2595–2920 п.н.) и соответствующего референсного фрагмента F. peregrinus (NC_000878.1:13715–16438).) по Rozhkova et al., 2026 (по лицензии CC BY). (а) Гаплотипическая сеть оригинальных последовательностей, построенная с исключением инделов методом INJ в программе PopArt v1.7 (Bandelt et al., 1999; Leigh, Bryant, 2015). (b. (б) Гаплотипическая сеть модифицированных последовательностей (таблица П2), построенная с включением инделов как пятого нуклеотида с использованием алгоритма MJ на веб-инструмента HaplowebMaker v1.0 (Spöri, Flot, 2020).. Кружки соответствуют гаплотипам и масштабированы пропорционально количеству особей. Штрихи обозначают эволюционные события. Гаплогруппы выделены эллипсами.
Медианная сеть (рисунок 2б4б) демонстрирует бóльшую близость «восточных» гаплотипов к общему предку относительно «западных», а также предковое положение гаплогруппы A относительно группы Б и субклады кречетов. Несмотря на наиболее близкое положение гаплогруппы A к внешнему виду, филогенетические отношения внутри неё остаются неясными. Гаплотипическая сеть, построенная методом INJ (рисунок 2а4а), показала аналогичную близость группы аналогично меньшее количество эволюционных событий между общим предковым гаплотипом и «восточной» гаплогруппой по сравнению с гаплогруппой Б. Несмотря на то что филогенетические отношения внутри гаплогруппы А к общему предку. Однакоостаются неясными, все её гаплотипы в пределах данной гаплогруппы характеризуются наличием пяти общих синапоморфийобладают пятью общими синапоморфиями, что указывает на период её независимой эволюции после дивергенции от общего предка.    
3.1.3. Анализ с помощью Байесовскогобайесовского подхода
Наиболее полный набор мт-последовательностей (56 образцов) был использован для филогенетической реконструкции с учетом различий в скорости эволюции кодирующих и некодирующих областей мт-генома (Wan et al., 2004) на основе байесовской статистики в программе BEAST v10.5.0 (Drummond, Rambaut, 2007; Suchard et al., 2018). Выбранное программное обеспечение позволяет использовать для анализа не только разные маркеры, но и неравновесные их выборки. Для усиления филогенетического сигнала и обеспечения надежного укоренения древа в данный набор были включены мт-последовательности двух внешних таксонов: 
•	два варианта гена цитохрома b F. biarmicus (номера в GenBank: EU233034.1 and EU233035.1),
•	фрагмент мт-генома, охватывающий полные последовательности цитохрома b, тРНК-Thr и контрольного региона, F. peregrinus (номер в GenBank: NC_000878.1: 13715–16438). 
Полученный набор данных (59 образцов: 56 оригинальных и три от внешних таксонов) включал только модифицированные последовательности контрольного региона (таблица П2). Что касается популяционной принадлежности исследуемых образцов, то они представляют географически обособленные популяции балобана: восточноевропейскую Крымского полуострова (7 образцов), тувинскую (29 особей), алтайскую (9 образцов, с учетом четырех выращенных в питомнике птиц фенотипа altaicus), хакасскую (три особи) и даурскую (1 образец). Для разрешения филогенетических противоречий между балобаномв результатах исследований, посвященных балобану и кречетомкречету, в выборку также было включено семь кречетов из дальневосточной популяции. 
Финальная выборка включала последовательности, отличающиеся по типу маркеров и ддине: две полные последовательности гена цитохрома b (EU233034.1, EU233035.1), 22 последовательности мт-генома от cytb до контрольного региона (включая NC_000878.1: 13715–16438), а также 35 частичных последовательностей контрольного региона. В рамках подготовки данных к анализу, эти данные сначала были разделены по маркерам на партиции в программе BEAUti:
1.	24 последовательности cytb, (1143 п.н.), 
2.	22 последовательности tRNAтРНК-Thr, (71 п.н.) 
3.	57 последовательностей контрольного региона: (≤1268 п.н.): 21 полная и 35 частичных, охватывающих как центральный, так и второй гипервариабельный домены.
К полученным партициям были применены следующие модели нуклеотидных замен: 
1.	GTR (Tavaré, 1986) с гамма-распределением (4 категории) для cytb, 
2.	HKY (Hasegawa et al., 1985) с гамма-распределением (4 категории) для tRNAтРНК-Thr, 
3.	GTR (Tavaré, 1986) с гамма-распределением (4 категории) и учетом инвариантных сайтов (I = 0.5) для контрольного региона. 
Кроме того, использовалась модель расслабленных молекулярных часов (relaxed molecular clock) с некоррелированным логнормальным распределением (uncorrelated lognormal distribution), а также подходящая для неполнах выборок данных модель «Birth-Death incomplete sampling» (Stadler, 2009). Некоторые значения априорных вероятностей (priors) и операторов (operators) были оптимизированы для адекватного учета изменчивости исследуемых последовательностей (таблица П4).
Для выявления гаплотипической принадлежности к митохондриальным гаплогруппам (Nittinger et al., 2007) были проведены предварительные прогоны, по результатам которых выборка была дополнительно разделена на «таксоны»: гаплогруппу A ("восточную"), гаплогруппу B ("западную") и внешнюю группу (F. peregrinus). Финальный прогон MCMC (метод Монте-Карло по схеме цепей Маркова) составлял 100 миллионов поколений с «сэмплированием» каждого 10 000 из них. После удаления (burn-in) первых 10% поколений, сходимость и эффективные объемы выборок (effective sample sizes, ESS>200) оценивались в программе Tracer v1.7.2 (Rambaut et al., 2018). 
Полученные в результате расчетов данные были проанализированы в программе TreeAnnotator v10.5.0 с помощью построения древа максимальной достоверности клад (maximum clade credibility, MCC) без учета (burn-in) первых 10% поколений, 90-процентным пределом апостериорной вероятности, средней высотой узлов (mean node heights) и 95%-интервалами наивысшей апостериорной плотности (highest posterior density, HPD). Полученное MCC-древо было визуализировано в программе FigTree v1.4.4 (Rambaut, 2018) с использованием опции пропорционального преобразования ветвей (transform branches proportionally).
В результате примененного подхода финальный набор данных составил 59 образцов и содержал как кодирующие последовательности цитохрома b и тРНК-Thr (для анализа давних периодов эволюции), так и некодирующий контрольный регион с его гипервариабельными доменами (для анализа недавних эволюционных событий). Как слещствиеследствие, был проведен анализ как оригинальных последовательностей 49 балобанов и семи кречетов, так и последовательностей внешних видов из базы данных GenBank – двух ланнеров (EU233034.1, EU233035.1) и одного сапсана (NC_000878.1: 13715–16438). В результате, было получено хорошо разрешенное филогенетическое древо (рисунок 35) с двумя основными кладами (A и Б) (апостериорная вероятность, PP = 1.0).
 
 
Рисунок 3 5. Байесовское филогенетическое древо, построенное на основе 59 митохондриальных последовательностей, спо Rozhkova et al., 2026 (по лицензии CC BY). Ветви пропорционально трансформированными ветвямитрансформированы для оптимальной визуализации. Значения апостериорных вероятностей указаны в узлах (≥0.79). Гаплогруппы обозначены квадратными скобками. Цветовая кодировка: светло-красный – ланнеры; светло-фиолетовый – кречеты; голубой – тувинские балобаны (FC); светло-зеленый – восточноевропейские FC; желтый – алтайские FC; оранжевый – хакасские FC; темно-фиолетовый – даурские FC; бесцветный – сапсан. Не выделен цветом – сапсан (внешняя группа).
В «восточную» гаплогруппу (А) попали не только азиатские балобаны из Тувы, Алтая и Хакасии, но и все кречеты. Гаплотипы последних образовали монофилетичную группу с высокой поддержкой (PP = 0.97), в которую также попал один гаплотип балобана (образец GF_D319_16B_2018_altaicus). Также в данной гаплогруппе отдельную ветвь составили ланнеры, несмотря на то, что данный вид является базальным в группе Hierofalco. «Западная» гаплогруппа объединила всех восточноевропейских балобанов, часть тувинских и алтайских, а таже единственного даурского. Выращенные в неволе «алтайские соколы» попали в обе группы, также как балобаны из исследуемых южносибирских популяций. В отличие от них, крымские балобаны из западной группировки обладали исключительно «западными» гаплотипами, а кречеты исключительно «восточными».   
3.1.4. Анализ функциональной значимости замен
Поскольку изменчивость кодирующего гена цитохрома b может отражать давние эволюционные события, мы предприняли её дополнительный анализ для выявления возможных молекулярных адаптаций в процессе возникновения двух исследуемых гаплогрупп. 
В рамках данного анализа функциональной значимости аминоксилотных замен (АКЗ) в гене цитохрома b мы применили ряд методов, включая стандартный расчет dN/dS, показавший преобладание синонимичных нуклеотидных замен над несинонимичными. Кроме того, для оценки эволюционного влияния АКЗ была использована филогенетическая топология, рассчитанная методом ML с привлечением соответствующих последовательностей пустельги обыкновенной Falco tinnunculus (Linnaeus, 1758) (EU196361.1: 13707-14849) и сапсана (JX029991.1: 13720-14862) в качестве внешних видов. Помимо 16 оригинальных последовательностей исследуемых видов были использованы референсные из базы данных GenBank: балобана (KP337902.1: 13714-14856) и кречета (NC_029359.1: 13720-14862). 
Сравнение 16 оригинальных последовательностей с референсными (балобана, кречета и сапсана) выявило позиции отличающихся аминокислот: 
•	Ala 191 Thr (571–573 пн), п.н.) у всех «западных» гаплотипов относительно «восточной» гаплогруппы и сапсана;
•	Ile 230 Thr (687–690 пн), п.н.) у «алтайского» балобана (GF_D319_16B_2018_altaicus), дополняющего субкладу кречетов в «восточной» гаплогруппе;  
•	Ala 294 Gly (880–882 пн), п.н.) у восточноевропейского балобана – MF_SFC09_2019_Crimea;  
•	Ser 305 Asn (913–915 пн),п.н.) и Thr 331 Ala (991–993 пн). п.н.) у восточноевропейского балобана – MF_FC38_2015_Crimea относительно исследуемых последовательностей балобанов и кречетов.  
Дополнительный сравнительный анализ распространенности выявленных АКЗ среди 17 других видов семейства Falconidae (Рожкова и др., 2021) показал наличие замен, что аминокислотные остатки 230, 305 и 331 отличаются у многих видов, в то время как АКЗ в 191 и 294 позициях были обнаружены только у балобана и кречета. 
Для построения 3D-моделей ссответствующего белка за основу были взяты данные структуры комплекса цитохромов bc1 (PDB ID: pdb_00003tgu) курицы Gallus gallus (Hao et al., 2012). Проведенное моделирование белка cytb (на основе референсной последовательности гена – KP337902.1: 13714-14856) на основе гомологии, его визуализация (рисунок 6) и анализ взаимодействия с другими элементами электрон-транспортной цепи позволили установить положение обнаруженных позиций с АКЗ (191, 230, 294, 305 и 331) в 11, 13, 16, 17 и 18 альфа-спиралях белка. 
 
Рисунок 6. Визуализация 3D-модели cytb, рассчитанной на основе гомологии белков с помощью алгоритмов сервера SWISS-MODEL. Расположение 191 и 331 аминокислот обозначено желтым и выделено зеленой окружностью на 11 и 18 альфа-спиралях, соответственно. Оранжевым показан протогем IX.
Кроме того, анализ показал близость 191 и 230 АКЗ к участкам белка, взаимодействующим с коферментом Q (посредством 13 аминокислот в положениях от 18 до 229) и протогемом IX. (посредством >20 аминокислот, от 42 до 187). В рамках комплесной оценки было также выполнено программное предсказание (PROVEAN)  функционального значения АКЗ. (< -2,5 – вредное,  > -2,5 – нейтральное). Согласно полученным оценкам 230 и 294 АКЗ могут иметь вредное воздействие на функцию белка cytb. Для анализа изменения физико-химических свойств аминокислот в ходе эволюции, мы использовали программу TreeSAAP с привлечением предварительно рассчитанного на основе 20 последовательностей (16 оригинальных и четырех референсных) филогенетического ML-древа.
Что касается алгоритма TreeSAAP, то топология филогенетического древа исследуемых образцов составляет основу для его расчетов – сопостовления наблюдаемого распределения изменений физико-химических свойств (31) аминокислот с распределением, ожидаемым в условиях селективной нейтральности и предполагаемого случайного характера АКЗ. Таким образом, положительный отбор свойств аминокислот на молекулярном уровне оценивается по положительным значениям Z-теста: достоверная оценка выше или равна +3.09 с вероятностью p<0.001. Причем, эти данные рассматриваются относительно восьми категорий значимости, отражающих влияние молекулярного положительного отбора на биохимические свойства белка. Категории с первой по третью отражают влияние отбора, направленного на поддержание оптимальной активности белка (положительного стабилизирующего), в то время как следующие пять категорий демонстрируют положительный дестабилизирующий отбор. Последний поддерживает радикальные изменения структурных и функциональных характеристик белка (Woolley et al., 2003; McClellan et al., 2005).  
В результате, среди оригинальных 16 последовательностей было выявлено семь гаплотипов и три АКЗ, предположительно находящихся под отбором. Последний подразумевает изменения физико-химических свойств аминокислот, в данном случае – энергии слабых (невалентных) взаимодействий (short and medium range non-bonded energy) и сжимаемости (compressibility). Изменение первого из указанных физико-химических свойств предполагается для АКЗ в 305 позиции (образец MF_FC38_2015_Crimea), в то время как второго для АКЗ в 331 позиции (MF_FC38_2015_Crimea, JX029991.1: 13720-14862). Оба эти измененияиз данных изменений аминокислотных свойств зафиксированы для 191 кодона при формировании 23-го предкового и последующих гаплотипов (рисунок П9).П7), т.е. при формировании «западной» гаплогруппы. 
3.2. Изменчивость микросателлитных локусов
Генотипы, полученные в рамках фрагментного анализа, использовались для дальнейшего исследования при успешной амплификации 8 и более локусов (из десяти, Hou et al., 2018), что связано с наличием в нашей выборке значительного числа образцов деградированной ДНК, полученных, например, из музейных экземпляров или линных перьев. Как следствие, финальный набор генотипов для выявления генетической структуры исследуемых популяций (рисунок 47) составил 198 образцов – 168 балобанов и 30 кречетов (таблица П1) и содержал минимальное количество (1,57%) пропущенных данных.