Загрузка данных


1. Основные типы индексов: Index, RangeIndex, MultiIndex, DatetimeIndex.
DatetimeIndex используется для работы с датами и временными рядами.

2. MultiIndex — это многоуровневый индекс. Отбор делается через .loc[] или xs() по нужному уровню.

3. Категориальный тип хранит уникальные значения один раз, а остальные — как ссылки, поэтому экономит память.

4. Порядок задаётся через Categorical(..., ordered=True) или .cat.reorder_categories(). Это нужно для сортировки и анализа.

5. pd.cut() делит данные на равные интервалы, pd.qcut() — на равные по количеству элементы группы.

6. Для ковариации и корреляции: .cov() и .corr().

7. .rolling() — скользящее окно (например, среднее за последние n значений), .expanding() — накопительное окно.

8. Медиана — середина данных, устойчива к выбросам. Среднее — обычное арифметическое. Медиана лучше при выбросах.

9. Накопленная сумма: .cumsum().

10. .value_counts() — считает количество каждого значения, .nunique() — количество уникальных значений.