Загрузка данных


1. 
Series — это одномерная структура данных в pandas с индексами (подписями).
Отличие от NumPy:
* есть индексы, а не просто позиции
* может хранить разные типы данных
* поддерживает выравнивание по индексам
* более “умная” работа с пропусками (NaN).
2. 
.index
и 
.values
* .index — возвращает индексы (метки строк)
* .values — возвращает сами значения (как массив NumPy)
s.index   # индексы
s.values  # значения
3. Разница 
.loc[]
и 
.iloc[]
* .loc[] — доступ по названиям (меткам)
* .iloc[] — доступ по позиции (номерам)
s.loc['a']   # по индексу
s.iloc[0]    # по позиции
4. Выравнивание при операциях
При сложении/вычитании Series данные автоматически выравниваются по индексам:
s1 + s2
* совпадающие индексы → считаются
* несовпадающие → NaN
5. Фильтрация по условию
Используется логическое выражение:
s[s > 10]
Можно комбинировать:
s[(s > 10) & (s < 20)]
6. 
.reindex()
Метод изменяет индексы Series/DataFrame.
s.reindex(['a', 'b', 'c'])
Используется когда:
* нужно перестроить порядок
* добавить недостающие индексы (появится NaN)
* привести данные к общей структуре
7. 
pd.read_csv()
для дат и индекса
Полезные параметры:
pd.read_csv(
    'file.csv',
    parse_dates=['Date'],   # преобразовать в datetime
    index_col='Date'        # сделать индексом
)
Дополнительно:
dayfirst=True   # если формат ДД-ММ
8. 
df['Close'].plot()
или:
df.plot()
Внутри используется Matplotlib.
Если нужно показать:
import matplotlib.pyplot as plt
plt.show()