Візуалізація даних за допомогою Python за допомогою Matplotlib
Візуалізація даних є важливою частиною аналізу даних, яка допомагає виявити ідеї та закономірності в даних. Matplotlib
— одна з найпоширеніших бібліотек для створення статичних, анімованих та інтерактивних графіків у Python. У цій статті ми розглянемо, як використовувати Matplotlib для створення різних типів візуалізацій.
Початок роботи з Matplotlib
Щоб розпочати роботу з Matplotlib, вам спочатку потрібно встановити його. Ви можете встановити Matplotlib за допомогою pip
:
pip install matplotlib
Після встановлення ви можете імпортувати Matplotlib у свій сценарій Python:
import matplotlib.pyplot as plt
Створення базових сюжетів
Matplotlib надає кілька типів графіків для візуалізації даних. Почнемо з кількох основних прикладів:
Лінійний сюжет
Лінійний графік корисний для показу тенденцій у часі або безперервних даних. Ось як створити простий лінійний графік:
import matplotlib.pyplot as plt
# Data
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# Create a line plot
plt.plot(x, y, marker='o')
plt.title('Simple Line Plot')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
plt.show()
Барна ділянка
Стовпчаста діаграма корисна для порівняння кількості в різних категоріях. Ось приклад такої схеми:
import matplotlib.pyplot as plt
# Data
categories = ['A', 'B', 'C', 'D']
values = [4, 7, 1, 8]
# Create a bar plot
plt.bar(categories, values)
plt.title('Simple Bar Plot')
plt.xlabel('Categories')
plt.ylabel('Values')
plt.show()
Гістограма
Гістограми використовуються для представлення розподілу числових даних. Ось як створити гістограму:
import matplotlib.pyplot as plt
# Data
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5]
# Create a histogram
plt.hist(data, bins=5, edgecolor='black')
plt.title('Histogram')
plt.xlabel('Bins')
plt.ylabel('Frequency')
plt.show()
Налаштування сюжетів
Matplotlib дозволяє широко налаштовувати графіки для покращення читабельності та естетики. Ось кілька варіантів налаштування:
Додавання міток і заголовків
Ви можете додавати заголовки, мітки осей і легенди, щоб зробити ваші графіки більш інформативними:
import matplotlib.pyplot as plt
# Data
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# Create a line plot with customization
plt.plot(x, y, marker='o', color='green', linestyle='--')
plt.title('Customized Line Plot')
plt.xlabel('X Axis Label')
plt.ylabel('Y Axis Label')
plt.legend(['Data Series'])
plt.grid(True)
plt.show()
Збереження сюжетів
Matplotlib дозволяє зберігати графіки як файли зображень для використання у звітах або презентаціях:
import matplotlib.pyplot as plt
# Data
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# Create a plot
plt.plot(x, y, marker='o')
plt.title('Line Plot to Save')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
# Save the plot as an image file
plt.savefig('line_plot.png')
Висновок
Matplotlib — це потужний інструмент для створення широкого діапазону візуалізацій на Python. Освоївши основи лінійних, стовпчастих і гістограм, а також навчившись налаштовувати та зберігати діаграми, ви зможете ефективно візуалізувати свої дані та отримати цінну інформацію. Експериментуйте з різними типами графіків і параметрами налаштування, щоб повністю використовувати можливості Matplotlib у своїх проектах аналізу даних.