1.
Series — это одномерная структура данных в pandas с индексами (подписями).
Отличие от NumPy:
* есть индексы, а не просто позиции
* может хранить разные типы данных
* поддерживает выравнивание по индексам
* более “умная” работа с пропусками (NaN).
2.
.index
и
.values
* .index — возвращает индексы (метки строк)
* .values — возвращает сами значения (как массив NumPy)
s.index # индексы
s.values # значения
3. Разница
.loc[]
и
.iloc[]
* .loc[] — доступ по названиям (меткам)
* .iloc[] — доступ по позиции (номерам)
s.loc['a'] # по индексу
s.iloc[0] # по позиции
4. Выравнивание при операциях
При сложении/вычитании Series данные автоматически выравниваются по индексам:
s1 + s2
* совпадающие индексы → считаются
* несовпадающие → NaN
5. Фильтрация по условию
Используется логическое выражение:
s[s > 10]
Можно комбинировать:
s[(s > 10) & (s < 20)]
6.
.reindex()
Метод изменяет индексы Series/DataFrame.
s.reindex(['a', 'b', 'c'])
Используется когда:
* нужно перестроить порядок
* добавить недостающие индексы (появится NaN)
* привести данные к общей структуре
7.
pd.read_csv()
для дат и индекса
Полезные параметры:
pd.read_csv(
'file.csv',
parse_dates=['Date'], # преобразовать в datetime
index_col='Date' # сделать индексом
)
Дополнительно:
dayfirst=True # если формат ДД-ММ
8.
df['Close'].plot()
или:
df.plot()
Внутри используется Matplotlib.
Если нужно показать:
import matplotlib.pyplot as plt
plt.show()