备注
前往结尾 以下载完整示例代码。
Pyplot 教程#
pyplot 接口的介绍。另请参阅 快速入门指南 以了解 Matplotlib 的工作原理,以及 Matplotlib 应用程序接口 (APIs) 以了解支持的用户 API 之间的权衡。
pyplot 简介#
matplotlib.pyplot
是一组函数,使 matplotlib 的工作方式类似于 MATLAB。每个 pyplot
函数都会对图形进行一些更改:例如,创建图形,在图形中创建绘图区域,在绘图区域中绘制一些线条,用标签装饰绘图等。
在 matplotlib.pyplot
中,各种状态在函数调用之间被保留,因此它可以跟踪当前的图形和绘图区域,并且绘图函数被定向到当前的 Axes(请注意,我们使用大写的 Axes 来指代 Axes
概念,这是图形的一个核心 部分,而不仅仅是 轴 的复数形式)。
备注
隐式 pyplot API 通常更简洁,但也不如显式 API 灵活。这里看到的绝大多数函数调用也可以作为 Axes
对象的方法调用。我们建议浏览教程和示例以了解其工作原理。有关支持的用户 API 之间的权衡解释,请参见 Matplotlib 应用程序接口 (APIs)。
使用 pyplot 生成可视化非常快捷:
import matplotlib.pyplot as plt
plt.plot([1, 2, 3, 4])
plt.ylabel('some numbers')
plt.show()

你可能会好奇为什么x轴的范围是0-3,而y轴的范围是1-4。如果你向 plot
提供一个单独的列表或数组,matplotlib会假设它是一个y值序列,并自动为你生成x值。由于Python的范围从0开始,默认的x向量与y具有相同的长度,但起始值为0;因此,x数据为 [0, 1, 2, 3]
。
plot
是一个多功能函数,可以接受任意数量的参数。例如,要绘制 x 对 y 的图,你可以写:
plt.plot([1, 2, 3, 4], [1, 4, 9, 16])

格式化图表的样式#
对于每一对 x, y 参数,有一个可选的第三个参数,即格式字符串,它指示了绘图的颜色和线型。格式字符串中的字母和符号来自 MATLAB,您可以将颜色字符串与线型字符串连接起来。默认的格式字符串是 'b-',即一条实心的蓝色线。例如,要以上述方式绘制红色圆圈,您可以发出
plt.plot([1, 2, 3, 4], [1, 4, 9, 16], 'ro')
plt.axis((0, 6, 0, 20))
plt.show()

查看 plot
文档以获取完整的线条样式和格式字符串列表。上述示例中的 axis
函数接受一个 [xmin, xmax, ymin, ymax]
列表,并指定 Axes 的视口。
如果 matplotlib 仅限于处理列表,那么它在数值处理方面将相当无用。通常,您会使用 numpy 数组。实际上,所有序列在内部都被转换为 numpy 数组。下面的示例演示了如何使用数组在一次函数调用中绘制具有不同格式样式的多条线。
import numpy as np
# evenly sampled time at 200ms intervals
t = np.arange(0., 5., 0.2)
# red dashes, blue squares and green triangles
plt.plot(t, t, 'r--', t, t**2, 'bs', t, t**3, 'g^')
plt.show()

使用关键字字符串绘图#
在某些情况下,你的数据格式允许你使用字符串访问特定的变量。例如,使用 结构化数组 或 pandas.DataFrame
。
Matplotlib 允许你使用 data
关键字参数提供这样一个对象。如果提供了,那么你可以使用与这些变量对应的字符串生成图表。
data = {'a': np.arange(50),
'c': np.random.randint(0, 50, 50),
'd': np.random.randn(50)}
data['b'] = data['a'] + 10 * np.random.randn(50)
data['d'] = np.abs(data['d']) * 100
plt.scatter('a', 'b', c='c', s='d', data=data)
plt.xlabel('entry a')
plt.ylabel('entry b')
plt.show()

使用分类变量绘图#
也可以使用分类变量创建图表。Matplotlib 允许你直接将分类变量传递给许多绘图函数。例如:
names = ['group_a', 'group_b', 'group_c']
values = [1, 10, 100]
plt.figure(figsize=(9, 3))
plt.subplot(131)
plt.bar(names, values)
plt.subplot(132)
plt.scatter(names, values)
plt.subplot(133)
plt.plot(names, values)
plt.suptitle('Categorical Plotting')
plt.show()

控制线条属性#
线条有许多属性可以设置:线宽、虚线样式、抗锯齿等;参见 matplotlib.lines.Line2D
。有几种方法可以设置线条属性
使用关键字参数:
plt.plot(x, y, linewidth=2.0)
使用
Line2D
实例的设置方法。plot
返回一个Line2D
对象的列表;例如,line1, line2 = plot(x1, y1, x2, y2)
。 在下面的代码中,我们将假设我们只有一条线,因此返回的列表长度为1。 我们使用元组解包line,
来获取该列表的第一个元素:line, = plt.plot(x, y, '-') line.set_antialiased(False) # turn off antialiasing
使用
setp
。 下面的示例使用 MATLAB 风格的函数来设置线条列表上的多个属性。setp
可以透明地处理对象列表或单个对象。 你可以使用 Python 关键字参数或 MATLAB 风格的字符串/值对:lines = plt.plot(x1, y1, x2, y2) # use keyword arguments plt.setp(lines, color='r', linewidth=2.0) # or MATLAB style string value pairs plt.setp(lines, 'color', 'r', 'linewidth', 2.0)
以下是可用的 Line2D
属性。
属性 |
值类型 |
---|---|
alpha |
浮动 |
动画 |
[是 | 否] |
抗锯齿或aa |
[是 | 否] |
clip_box |
一个 matplotlib.transform.Bbox 实例 |
clip_on |
[是 | 否] |
clip_path |
一个 Path 实例和一个 Transform 实例,一个 Patch |
颜色 或 c |
任何 matplotlib 颜色 |
包含 |
命中测试函数 |
dash_capstyle |
[ |
dash_joinstyle |
[ |
dashes |
点中的开/关墨水序列 |
数据 |
(np.array xdata, np.array ydata) |
figure |
一个 matplotlib.figure.Figure 实例 |
标签 |
任意字符串 |
线条样式或ls |
[ |
linewidth 或 lw |
以点为单位的浮动值 |
标记 |
[ |
markeredgecolor 或 mec |
任何 matplotlib 颜色 |
markeredgewidth 或 mew |
以点为单位的浮动值 |
markerfacecolor 或 mfc |
任何 matplotlib 颜色 |
markersize 或 ms |
浮动 |
markevery |
[ 无 | 整数 | (起始索引, 步长) ] |
选择器 |
用于交互式行选择 |
pickradius |
线条拾取选择半径 |
solid_capstyle |
[ |
solid_joinstyle |
[ |
变换 |
一个 matplotlib.transforms.Transform 实例 |
可见的 |
[是 | 否] |
xdata |
np.array |
ydata |
np.array |
zorder |
任意数量 |
要获取可设置的线条属性列表,请使用线条或线条作为参数调用 setp
函数。
In [69]: lines = plt.plot([1, 2, 3])
In [70]: plt.setp(lines)
alpha: float
animated: [True | False]
antialiased or aa: [True | False]
...snip
使用多个图形和轴#
MATLAB 和 pyplot
有当前图形和当前 Axes 的概念。所有绘图函数都应用于当前 Axes。函数 gca
返回当前 Axes(一个 matplotlib.axes.Axes
实例),而 gcf
返回当前图形(一个 matplotlib.figure.Figure
实例)。通常,您不必担心这一点,因为这一切都在幕后处理好了。下面是一个创建两个子图的脚本。
def f(t):
return np.exp(-t) * np.cos(2*np.pi*t)
t1 = np.arange(0.0, 5.0, 0.1)
t2 = np.arange(0.0, 5.0, 0.02)
plt.figure()
plt.subplot(211)
plt.plot(t1, f(t1), 'bo', t2, f(t2), 'k')
plt.subplot(212)
plt.plot(t2, np.cos(2*np.pi*t2), 'r--')
plt.show()

这里的 figure
调用是可选的,因为如果没有现成的图形,将会创建一个图形,就像如果没有现成的 Axes 也会被创建(相当于显式的 subplot()
调用)一样。subplot
调用指定了 numrows, numcols, plot_number
,其中 plot_number
的范围从 1 到 numrows*numcols
。如果 numrows*numcols<10
,subplot
调用中的逗号是可选的。因此,subplot(211)
与 subplot(2, 1, 1)
是相同的。
你可以创建任意数量的子图和坐标轴。如果你想手动放置一个坐标轴,即不在一个矩形网格上,使用 axes
,它允许你指定位置为 axes([left, bottom, width, height])
,其中所有值都在分数坐标(0 到 1)中。参见 坐标轴演示 以获取手动放置坐标轴的示例,以及 多个子图 以获取包含大量子图的示例。
你可以通过使用递增的图号调用多个 figure
来创建多个图形。当然,每个图形可以包含你想要的任意数量的轴和子图:
import matplotlib.pyplot as plt
plt.figure(1) # the first figure
plt.subplot(211) # the first subplot in the first figure
plt.plot([1, 2, 3])
plt.subplot(212) # the second subplot in the first figure
plt.plot([4, 5, 6])
plt.figure(2) # a second figure
plt.plot([4, 5, 6]) # creates a subplot() by default
plt.figure(1) # first figure current;
# subplot(212) still current
plt.subplot(211) # make subplot(211) in the first figure
# current
plt.title('Easy as 1, 2, 3') # subplot 211 title
你可以使用 clf
清除当前图形,使用 cla
清除当前的 Axes。如果你觉得状态(特别是当前图像、图形和 Axes)在幕后为你维护很烦人,不要绝望:这只是一个围绕面向对象 API 的薄状态包装器,你可以改用它(参见 艺术家教程)。
如果你在制作大量图形,你需要意识到一件事:图形所需的内存不会完全释放,直到使用 close
显式关闭图形。删除对图形的所有引用,和/或使用窗口管理器关闭屏幕上显示图形的窗口,是不够的,因为 pyplot 会维护内部引用,直到调用 close
。
处理文本#
text
可以用于在任意位置添加文本,而 xlabel
、ylabel
和 title
用于在指定位置添加文本(参见 Matplotlib 中的文本 了解更多详细示例)
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
# the histogram of the data
n, bins, patches = plt.hist(x, 50, density=True, facecolor='g', alpha=0.75)
plt.xlabel('Smarts')
plt.ylabel('Probability')
plt.title('Histogram of IQ')
plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
plt.axis([40, 160, 0, 0.03])
plt.grid(True)
plt.show()

所有 text
函数都返回一个 matplotlib.text.Text
实例。与上面的线条一样,您可以通过将关键字参数传递给文本函数或使用 setp
来自定义属性:
t = plt.xlabel('my data', fontsize=14, color='red')
这些属性在 文本属性和布局 中有更详细的介绍。
在文本中使用数学表达式#
Matplotlib 接受任何文本表达式中的 TeX 方程表达式。例如,要在标题中写入表达式
plt.title(r'$\sigma_i=15$')
标题字符串前的 r
是重要的——它表示该字符串是一个 原始 字符串,不会将反斜杠视为 Python 转义字符。matplotlib 内置了一个 TeX 表达式解析器和布局引擎,并自带数学字体——详情请参阅 书写数学表达式。因此,您可以在没有 TeX 安装的情况下跨平台使用数学文本。对于那些安装了 LaTeX 和 dvipng 的用户,您也可以使用 LaTeX 来格式化您的文本,并将输出直接合并到您的显示图形或保存的 postscript 中——详情请参阅 使用 LaTeX 进行文本渲染。
注释文本#
上述基本 text
函数的使用将文本放置在 Axes 上的任意位置。文本的一个常见用途是注释图形的某些特征,而 annotate
方法提供了辅助功能,使注释变得容易。在注释中,有两个点需要考虑:被注释的位置,由参数 xy
表示,以及文本的位置 xytext
。这两个参数都是 (x, y)
元组。
ax = plt.subplot()
t = np.arange(0.0, 5.0, 0.01)
s = np.cos(2*np.pi*t)
line, = plt.plot(t, s, lw=2)
plt.annotate('local max', xy=(2, 1), xytext=(3, 1.5),
arrowprops=dict(facecolor='black', shrink=0.05),
)
plt.ylim(-2, 2)
plt.show()

在这个基本示例中,xy``(箭头尖端)和 ``xytext
位置(文本位置)都在数据坐标中。还有许多其他坐标系可供选择——详情请参阅 基本注释 和 高级注解。更多示例可以在 标注图表 中找到。
对数和其他非线性轴#
matplotlib.pyplot
不仅支持线性轴刻度,还支持对数和logit刻度。如果数据跨越多个数量级,这通常会被使用。更改轴的刻度很容易:
plt.xscale('log')
下面展示了一个包含四张图的例子,这些图使用了相同的数据,但y轴的刻度不同。
# Fixing random state for reproducibility
np.random.seed(19680801)
# make up some data in the open interval (0, 1)
y = np.random.normal(loc=0.5, scale=0.4, size=1000)
y = y[(y > 0) & (y < 1)]
y.sort()
x = np.arange(len(y))
# plot with various axes scales
plt.figure()
# linear
plt.subplot(221)
plt.plot(x, y)
plt.yscale('linear')
plt.title('linear')
plt.grid(True)
# log
plt.subplot(222)
plt.plot(x, y)
plt.yscale('log')
plt.title('log')
plt.grid(True)
# symmetric log
plt.subplot(223)
plt.plot(x, y - y.mean())
plt.yscale('symlog', linthresh=0.01)
plt.title('symlog')
plt.grid(True)
# logit
plt.subplot(224)
plt.plot(x, y)
plt.yscale('logit')
plt.title('logit')
plt.grid(True)
# Adjust the subplot layout, because the logit one may take more space
# than usual, due to y-tick labels like "1 - 10^{-3}"
plt.subplots_adjust(top=0.92, bottom=0.08, left=0.10, right=0.95, hspace=0.25,
wspace=0.35)
plt.show()

也可以添加自己的刻度,详情请参见 matplotlib.scale
。
脚本的总运行时间: (0 分钟 1.269 秒)