1. Основные типы индексов: Index, RangeIndex, MultiIndex, DatetimeIndex.
DatetimeIndex используется для работы с датами и временными рядами.
2. MultiIndex — это многоуровневый индекс. Отбор делается через .loc[] или xs() по нужному уровню.
3. Категориальный тип хранит уникальные значения один раз, а остальные — как ссылки, поэтому экономит память.
4. Порядок задаётся через Categorical(..., ordered=True) или .cat.reorder_categories(). Это нужно для сортировки и анализа.
5. pd.cut() делит данные на равные интервалы, pd.qcut() — на равные по количеству элементы группы.
6. Для ковариации и корреляции: .cov() и .corr().
7. .rolling() — скользящее окно (например, среднее за последние n значений), .expanding() — накопительное окно.
8. Медиана — середина данных, устойчива к выбросам. Среднее — обычное арифметическое. Медиана лучше при выбросах.
9. Накопленная сумма: .cumsum().
10. .value_counts() — считает количество каждого значения, .nunique() — количество уникальных значений.