下推自动机

Template:Cleanup-jargon 在自动机理论中，下推自动机（Template:Lang-en）是使用了包含数据的栈的有限自动机。

综述

下推自动机比有限自动机复杂：除了有限状态组成部分外，还包括一个长度不受限制的栈；下推自动机的状态迁移不但要参考有限状态部分，也要参照栈当前的状态；状态迁移不但包括有限状态的变迁，还包括一个栈的出栈或入栈过程。下推自动机可以形象的理解为，藉由加上读取一个容量无限栈的能力，扩充一个能做 $ϵ$ -转移的非确定有限自动机。

下推自动机存在“确定”与“非确定”两种形式，两者并不等价。（对有限自动机两者是等价的）

每一个下推自动机都接受一个形式语言。被“非确定下推自动机”接受的语言是上下文无关语言。

如果我们把下推自动机扩展，允许一个有限自动机存取两个栈，我们得到一个能力更强的自动机，这个自动机与图灵机等价。

下推自动机作为一个形式系统最早于1961年出现在 Oettinger 的论文中。它与上下文无关文法的等价性是由乔姆斯基于1962年发现的。

形式定义

PDA 形式定义为 6-元组：

$M = (Q, Σ, Γ, δ, q_{0}, F)$ 这里的

$Q$ 是状态的有限集合
$Σ$ 是输入字母表的有限集合
$Γ$ 是栈字母表的有限集合
$δ$ : $Q \times Σ_{ϵ} \times Γ_{ϵ} ⟶ 𝒫 (Q \times Γ_{ϵ})$ 是转移函数
$q_{0}$ 是“开始状态”
$F \subset Q$ 是“接受状态”的集合
$Γ_{ϵ} = Γ \cup {ϵ}$
$Σ_{ϵ} = Σ \cup {ϵ}$

计算定义 1

对于任何 PDA $M = (Q, Σ, Γ, δ, q_{0}, F)$ ，计算路径是一个有序的（n+1）-元组 $(q_{0}, q_{1}, ...., q_{n})$ ，这里的 $q_{i} \in Q, n \geq 0$ ，它满足如下条件：

(i) $(q_{i + 1}, b_{i + 1}) \in δ (q_{i}, w_{i + 1}, a_{i + 1})$ 对于 i = 0, 1, 2,......, n-1,

这里的

w_{i + 1} \in Σ_{ϵ}, a_{i + 1}, b_{i + 1} \in Γ_{ϵ}

(ii) $\exists s_{0}, s_{1}, s_{2}, s_{3}, \dots, s_{n} \in Γ^{*}$ 使得

s_{i} = a_{i + 1} t_{i}, s_{i + 1} = b_{i + 1} t_{i}, t_{i} \in Γ^{*}

在直觉上，PDA 在计算过程中任何一点上都面对着多种可能性，从栈顶读一个符号并把它替代为另一个符号，从栈顶读一个符号并删除它而不替换，不从栈顶读任何符号但压入另一个符号进去，或什么都不做。所有这些都同时由等式 $s_{i} = a_{i + 1} t_{i}$ 和 $s_{i + 1} = b_{i + 1} t_{i}$ 来支配。 $s_{i}$ 是紧接在第 i+1 次转移移动之前的栈内容，而 $a_{i + 1}$ 是要从栈顶去除的符号。 $s_{i + 1}$ 是紧接在第 i+1 次转移移动之后栈内容，而 $b_{i + 1}$ 是在第 i+1 次转移移动期间要增加到栈上的符号。

$a_{i + 1}$ 和 $b_{i + 1}$ 二者都可以 $ϵ$ 。

如果 $a_{i + 1} \neq ϵ$ 而 $b_{i + 1} \neq ϵ$ ，则 PDA 从栈读一个符号并把它替代为另一个符号。

如果 $a_{i + 1} \neq ϵ$ 而 $b_{i + 1} = ϵ$ ，则 PDA 从栈读一个符号并删除它而不替换。

如果 $a_{i + 1} = ϵ$ 而 $b_{i + 1} \neq ϵ$ ，则 PDA 简单的增加一个符号到栈上。

如果 $a_{i + 1} = ϵ$ 而 $b_{i + 1} = ϵ$ ，则 PDA 保持栈不变动。

注意当 n=0 时，计算路径就是单元素集合 $(q_{0})$ 。

计算定义 2

对于任何输入 $w = w_{1} w_{2} \dots w_{m}, w_{i} \in Σ, m \geq 0$ ，M 接受 w，如果存在计算路径 $(q_{0}, q_{1}, ...., q_{n})$ 和有限序列 $r_{0}, r_{1}, r_{2}, \dots r_{m} \in Q, m \leq n$ ，使得

(i) 对于每个 i = 0, 1, 2,...m， $r_{i}$ 都在计算路径上。就是说

\exists f (i)

这里的

i \leq f (i) \leq n

使得

r_{i} = q_{f (i)}

(ii) $(q_{f (i) + 1}, b_{f (i) + 1}) \in δ (r_{i}, w_{i + 1}, a_{f (i) + 1})$ 对于每个 i = 0, 1, 2,...m-1。

这里的

a_{f (i) + 1}

和

b_{f (i) + 1}

定义同于计算定义 1。

(iii) $(q_{j + 1}, b_{j + 1}) \in δ (q_{j}, ϵ, a_{j + 1})$ ，如果 $q_{j} \notin {r_{0}, r_{1}, \dots r_{m}}$

这里的

a_{j + 1}

和

b_{j + 1}

定义同于计算定义 1。

(iv) $r_{m} = q_{n}$ 且 $r_{m} \in F$

注意上述定义不提供测试空栈的机制。要这么做你需要在所有计算开始前在栈上写一个特殊符号，使得 PDA 可以在检测到这个符号的时候有效的识别出栈已经空了。形式的说，实现它可通过介入转移 $δ (q_{0}, ϵ, ϵ) = {(q_{1}, $)}$ 这里的 $ 是特殊符号。

例子

下面是识别语言 ${0^{n} 1^{n} | n \geq 0}$ 的 PDA 的形式描述：

$M = (Q, Σ, Γ, δ, q_{1}, F)$

$Q = {q_{1}, q_{2}, q_{3}, q_{4}}$

$Σ = {0, 1}$

$Γ = {0, $}$

$F = {q_{1}, q_{4}}$

$δ (q_{1}, ϵ, ϵ) = {(q_{2}, $), (q_{1}, ϵ)}$

$δ (q_{2}, 0, ϵ) = {(q_{2}, 0)}$

$δ (q_{2}, 1, 0) = {(q_{3}, ϵ)}$

$δ (q_{3}, 1, 0) = {(q_{3}, ϵ)}$

$δ (q_{3}, ϵ, $) = {(q_{4}, ϵ)}$

$δ (q, w, a) = \emptyset$ 对于任何其他状态、输入和栈符号的值。

理解计算过程

下面展示上述 PDA 如何计算不同的输入字符串。

(a) 输入字符串 = 0011

(i) 写

δ

(q₁,

ϵ

,

ϵ

)

\to

(q₂, $) 来表示 (q₂, $)

\in

δ

(q₁,

ϵ

,

ϵ

)

s₀ =

ϵ

, s₁ = $, t =

ϵ

, a =

ϵ

, b = $

设置 r₀ = q₂

(ii)

δ

(r₀, 0,

ϵ

) =

δ

(q₂, 0,

ϵ

)

\to

(q₂, 0)

s₁ = $, a =

ϵ

, t = $, b = 0, s₂ = 0$

设置 r₁ = q₂

(iii)

δ

(r₁, 0,

ϵ

) =

δ

(q₂, 0,

ϵ

)

\to

(q₂, 0)

s₂ = 0$, a =

ϵ

, t = 0$, b = 0, s₃ = 00$

设置 r₂ = q₂

(iv)

δ

(r₂, 1, 0) =

δ

(q₂, 1, 0)

\to

(q₃,

ϵ

)

s₃ = 00$, a = 0, t = 0$, b =

ϵ

, s₄ = 0$

设置 r₃ = q₃

(v)

δ

(r₃, 1, 0) =

δ

(q₃, 1, 0)

\to

(q₃,

ϵ

)

s₄ = 0$, a = 0, t = $, b =

ϵ

, s₅ = $

(vi)

δ

(q₃,

ϵ

, $)

\to

(q₄,

ϵ

)

s₅ = $, a = $, t =

ϵ

, b =

ϵ

, s₆ =

ϵ

设置 r₄ = q₄

因为 q₄ 是接受状态，0011 被接受。

作为总结，计算路径 = (q₁, q₂, q₂, q₂, q₃, q₃, q₄)

而 (r₀, r₁, r₂, r₃, r₄) = (q₂, q₂, q₂, q₃, q₄)

(b) 输入字符串 = 001

计算移动 (i), (ii), (iii), (iv) 将必定同于情况 (a)，否则，PDA 在到达 (v) 之前就已经进入死胡同。

(v)

δ

(r₃,

ϵ

, a) =

δ

(q₃,

ϵ

, a)

因为 s₄ = 0$，要么 a =

ϵ

要么 a = 0

在任何一种情况下，

δ

(q₃,

ϵ

, a) =

\emptyset

因此计算在 r₃ = q₃ 进入死胡同，这不是接受状态。所以 001 被拒绝。

(c) 输入字符串 = $ϵ$

设置 r₀ = q₁, r₁ = q₁

δ

(r₀,

ϵ

,

ϵ

)

\to

(q₁,

ϵ

)

因为 q₁ 是接受状态，

ϵ

被接受。

广义下推自动机(GPDA)

GPDA 是在一个步骤内写入整个字符串到栈上或从栈上去除整个字符串的 PDA。

GPDA 形式定义为 6-元组 $M = (Q, Σ, Γ, δ, q_{0}, F)$

这里的 Q,

Σ

,

Γ

, q₀ 和 F 的定义同于 PDA。

δ

:

Q \times Σ_{ϵ} \times Γ^{*} ⟶ 𝒫 (Q \times Γ^{*})

是转移函数。

GPDA 的计算规则同于 PDA，除了 a_i+1 和 b_i+1 现在是字符串而不是符号之外。

GPDA 和 PDA 是等价的，如果一个语言可被一个 PDA 识别，它也可被一个 GPDA 识别，反之亦然。

可以使用下列模拟公式化对 GPDA 和 PDA 的等价性的一个分析式证明：

设 $δ$ (q₁, w, x₁x₂...x_m) $⟶$ (q₂, y₁y₂...y_n) 是 GPDA 的转移。

这里的 q₁, q₂ $\in$ Q, w $\in Σ_{ϵ}$ , x₁x₂...x_m $\in Γ^{*}$ , m $\geq$ 0, y₁y₂...y_n $\in Γ^{*}$ , n $\geq$ 0。

构造 PDA 的下列转移：

δ^{'}

(q₁, w, x₁)

⟶

(p₁,

ϵ

)

δ^{'}

(p₁,

ϵ

, x₂)

⟶

(p₂,

ϵ

)

⋮

δ^{'}

(p_m-1,

ϵ

, x_m)

⟶

(p_m,

ϵ

)

δ^{'}

(p_m,

ϵ

,

ϵ

)

⟶

(p_m+1, y_n)

δ^{'}

(p_m+1,

ϵ

,

ϵ

)

⟶

(p_m+2, y_n-1)

⋮

δ^{'}

(p_m+n-1,

ϵ

,

ϵ

)

⟶

(q₂, y₁)

参见

外部链接

non-deterministic pushdown automaton, on Planet Math.
JFLAP Template:Wayback，simulator for several types of automata including nondeterministic pushdown automata

参考书目

《自动机理论、语言和计算导引》，John E. Hopcroft，Jeffery D. Ullman，徐美瑞译，洪加威校，科学出版社，1986年
Template:Cite book Section 2.2: Pushdown Automata, pp.101–114.

Template:形式语言与形式文法

下推自动机

目录

综述

形式定义

例子

理解计算过程

广义下推自动机(GPDA)

参见

外部链接

参考书目

导航菜单

下推自动机

综述

形式定义

例子

理解计算过程

广义下推自动机(GPDA)

参见

外部链接

参考书目

导航菜单

搜索