怎么理解PostgreSQL的詞法分析

發(fā)布時(shí)間：2021-11-09 14:30:16 來源：億速云閱讀：213 作者：iii 欄目：關(guān)系型數(shù)據(jù)庫

這篇文章主要講解了“怎么理解PostgreSQL的詞法分析”，文中的講解內(nèi)容簡(jiǎn)單清晰，易于學(xué)習(xí)與理解，下面請(qǐng)大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“怎么理解PostgreSQL的詞法分析”吧！

一、詞法分析

基本概念
首先來理清一些基本概念.
詞法分析從左向右掃描輸入的SQL語句，將其字符流分割成一個(gè)個(gè)的詞(稱為token),這些token是輸入流中不可再分割的一串字符，類似于英語中單詞，或漢語中的詞。
SQL語句中token的類別是有限的,一般來說有常量(數(shù)值/字符/字符串等),操作符(算術(shù)操作符/邏輯操作符等),分隔符(逗號(hào)/分號(hào)/括號(hào)等),保留關(guān)鍵字,標(biāo)識(shí)符(函數(shù)名/過程名等).如:1和200.13是數(shù)值常量token,’張三’和’廣州市’是字符串常量token,+/-等是操作符token等.

Flex簡(jiǎn)介
在PostgreSQL中,使用了開源的Flex對(duì)SQL進(jìn)行詞法分析.
Flex全稱為Fast LEXical analyser generator - scanner generator for lexing in C and C++.
Flex的輸入文件格式為:

%{
Declarations(聲明)
%}
Definitions(定義)
%%
Rules(規(guī)則)
%%
User subroutines(用戶子過程)

如:

%{
    #define T_ZEOR 0
    int i = 0;
%}
NUM ([0-9]+)
%%
{NUM}  printf("?");     //遇到數(shù)字,打印?
#       return T_ZEOR;  //遇到字符#,返回0
.       ECHO;           //遇到其他字符,打印該字符
%%
int main(int argc, char* argv[]) {
    yylex();
    return T_ZEOR;
}
int yywrap() {
    return 1;
}

該例程的運(yùn)行效果如下:

[root@localhost mytest]# ./mytest 
1t33..q
?t?..q
#

SQL詞法分析器
使用Flex可以實(shí)現(xiàn)一個(gè)簡(jiǎn)單的SQL詞法分析器,簡(jiǎn)單分為以下幾個(gè)步驟:
1.列出SQL中所有類型的token
2.為每種token分配一個(gè)唯一的編號(hào),同時(shí)寫出該token的正則表達(dá)式
3.寫出每種token的rule

sql.l

%{
int current_linenum = 1;
void init();
void elog(char* msg, int line);
typedef enum {
    T_EQUAL = 128   ,
    T_SELECT    ,
    T_CONST     ,
    T_STRING    ,
    T_ID
} TokeType;
static char* string_token[] = {
        "T_EQUAL", "T_SELECT", "T_CONST", "T_STRING", "T_ID"
    };
%}
INTEGER             ([0-9]+)
UNTERM_STRING       ("'"[^'\n]*)
STRING              ("'"[^'\n]*"'")
IDENTIFIER          ([_a-zA-Z][_a-zA-Z0-9]*)
OPERATOR            ([+*-/%=,;!<>(){}])
SINGLE_COMMENT      ("//"[^\n]*)
%%
[\n]                { current_linenum++;                       }
[ \t\r\a]+          { /* ignore all spaces */               }
{SINGLE_COMMENT}    { /* skip for single line comment */    }
{OPERATOR}          { return yytext[0];         }   
"="                 { return T_EQUAL;           }
"select"            { return T_SELECT;          }
{INTEGER}           { return T_CONST;       }
{STRING}            { return T_STRING;      }
{IDENTIFIER}        { return T_ID;          }
<<EOF>>             { return 0; }
{UNTERM_STRING}     { elog("Unterminated string constant", current_linenum);  }
.                   { elog("Unrecognized character", current_linenum);        }
%%
int main(int argc, char* argv[]) {
    int token;
    init();
    while (token = yylex()) {
    if(token < 128) 
            printf("%-20c", token);
    else
        printf("%-20s",string_token[token - 128]);
        puts(yytext);
    }
    return 0;
}
void init() {
    printf("%-20s%s\n", "TOKEN-TYPE", "TOKEN-VALUE");
    printf("-------------------------------------------------\n");
}
void elog(char* msg, int line) {
    printf("\nError at line %-3d: %s\n\n", line, msg);
}
int yywrap(void) {
    return 1;
}

makefile

run: sql
    ./sql < test.sql
sql: lex.yy.c
    gcc -o $@ $<
lex.yy.c: sql.l
    flex $<

樣例SQL腳本

select *
from test1
where c1 = 'TEST';

執(zhí)行結(jié)果:

[root@localhost sql]# make
./sql < test.sql
TOKEN-TYPE          TOKEN-VALUE
-------------------------------------------------
T_SELECT            select
*                   *
T_ID                from
T_ID                test1
T_ID                where
T_ID                c1
=                   =
T_STRING            'TEST'
;                   ;

感謝各位的閱讀，以上就是“怎么理解PostgreSQL的詞法分析”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對(duì)怎么理解PostgreSQL的詞法分析這一問題有了更深刻的體會(huì)，具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云，小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章，歡迎關(guān)注！

向AI問一下細(xì)節(jié)

怎么理解PostgreSQL的詞法分析

一、詞法分析

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽