自底向上分析概述

自底向上的语法分析¶

自底向上语法分析的通用框架

在对输入串的一次从左到右扫描过程中，语法分析器将零个或多个输入符号移入到栈的顶端，直到它可以对栈顶的一个文法符号串β进行归约为止
然后，它将β归约为某个产生式的左部
语法分析器不断地重复这个循环，直到它检测到一个语法错误，或者栈中包含了开始符号且输入缓冲区为空(当进入这样的格局时，语法分析器停止运行，并宣称成功完成了语法分析)为止

例：有如下产生式

E -> E + E
E -> E * E
E -> (E)
E -> id

移入-归约分析器可采取的4种动作

例：有产生式

<S> -> var<IDS>:<T>
<IDS> -> i
<IDS> -> <IDS>, i
<T> -> real|int

在上述分析过程中，红线处存在歧义，即$i_B$既可以单独归约为<IDS>，也可以与栈中的<IDS>,一同归约为<IDS>，这样便会错误地识别句柄

LR文法(Knuth, 1963) 是最大的、可以构造出相应移入-归约句法分析器的文法类

L指的是对输入从左到右进行扫描
R指的是反向构造出一个最右推导序列

LR(k)分析

需要向前查看k个输入符号的LR分析

k=0和k=1这两种情况具有实践意义,当省略(k)时，表示k=1

LR分析器核心结构为LR分析表，其包含两个部分：

例：有如下文法

S->BB
B->aB
B->b

sn:将符号a、状态n压入栈中
rn:用第n个产生式进行归约

对输入字符串$a_1a_2a_3\dots a_n\$$

s0s1 … sm x 
$ X1 … Xm ai

s0s1 … sm-k
$ X1 … Xm-k A

如果$GOTO[s_{m-k}, A]=y$，那么格局变为

s0s1 … sm-k y  
$ X1 … Xm-k A

那么如何构造LR分析表？