一個簡單C語言的詞法分析器

阿新 • • 發佈：2019-01-12

一個簡單C語言的詞法分析器

語言的詞法構成：

識別符號

id  同C語言識別符號

常量

num 數字  
ch  字元
str 字串

關鍵字

kw_int  int
kw_char char        
kw_void void        
kw_if   if      
kw_else else    
kw_switch   switch      
kw_case case    
kw_default  default     
kw_while    while   
kw_do   do      
kw_for  for 
kw_break 
    break       
kw_continue continue        
kw_return   return

運算子

add +       
sub -       
mul *       
div /
mod %
inc ++
dec --
not !
and &&
or  ||
assign  =
gt  >
ge  >=
lt  <
le  <=
equ ==
nequ    !=

分界符

comma   ,
colon   :
simcon  ;
lparen  (
rparen  )
lbrac 
   {
rbrac   }

程式碼：

#include<stdio.h>
#include<string.h>

char input[200];//存放輸入字串
char token[10];//存放構成單詞符號的字串
char toke;
char ch;     //存放當前讀入字元
int fg;     //switch標記
int num;    //存放整形值
int p=0;//input[]下標

//二維字元陣列，存放關鍵字
char character[13][10]={"int","char","void","if","else","switch","case","default" 
,"while","do","for","break","continue","return"};
//二維字元陣列，存放含義定義
char index[42][15]={"id","num","str","kw_int","kw_char","kw_void","kw_if","kw_else","kw_switch","kw_case","kw_default","kw_while","kw_do","kw_for","kw_break","kw_continue","kw_return","add","sub","mul","div","mod","inc","dec","not","and","or","assign","gt","ge","lt","le","equ","nequ","comma","colon","simcon","lparen","rparen","lbrac","rbrac","ch"};
main()
{
    printf("請輸入程式碼(結尾以'#'作為結束):\n");
    do
    {
        ch=getchar();
        input[p++]=ch;
    }while(ch!='#');
    p=0;
    do
    {
        scaner();
        switch(fg)
        {
            case 0:printf("** %s-->%s **\n",token,index[fg]);break;//識別符號
            case 1:printf("** %d-->%s **\n",num,index[fg]);break;//數字

            case 2:printf("** %s-->%s **\n",token,index[fg]);break;//字串

            case 3:printf("** %s-->%s **\n",token,index[fg]);break;//關鍵字
            case 4:printf("** %s-->%s **\n",token,index[fg]);break;
            case 5:printf("** %s-->%s **\n",token,index[fg]);break;
            case 6:printf("** %s-->%s **\n",token,index[fg]);break;
            case 7:printf("** %s-->%s **\n",token,index[fg]);break;
            case 8:printf("** %s-->%s **\n",token,index[fg]);break;
            case 9:printf("** %s-->%s **\n",token,index[fg]);break;
            case 10:printf("** %s-->%s **\n",token,index[fg]);break;
            case 11:printf("** %s-->%s **\n",token,index[fg]);break;
            case 12:printf("** %s-->%s **\n",token,index[fg]);break;
            case 13:printf("** %s-->%s **\n",token,index[fg]);break;
            case 14:printf("** %s-->%s **\n",token,index[fg]);break;
            case 15:printf("** %s-->%s **\n",token,index[fg]);break;
            case 16:printf("** %s-->%s **\n",token,index[fg]);break;

            case 17:printf("** %s-->%s **\n",token,index[fg]);break;//運算子
            case 18:printf("** %s-->%s **\n",token,index[fg]);break;
            case 19:printf("** %s-->%s **\n",token,index[fg]);break;
            case 20:printf("** %s-->%s **\n",token,index[fg]);break;
            case 21:printf("** %s-->%s **\n",token,index[fg]);break;
            case 22:printf("** %s-->%s **\n",token,index[fg]);break;
            case 23:printf("** %s-->%s **\n",token,index[fg]);break;
            case 24:printf("** %s-->%s **\n",token,index[fg]);break;
            case 25:printf("** %s-->%s **\n",token,index[fg]);break;
            case 26:printf("** %s-->%s **\n",token,index[fg]);break;
            case 27:printf("** %s-->%s **\n",token,index[fg]);break;
            case 28:printf("** %s-->%s **\n",token,index[fg]);break;
            case 29:printf("** %s-->%s **\n",token,index[fg]);break;
            case 30:printf("** %s-->%s **\n",token,index[fg]);break;
            case 31:printf("** %s-->%s **\n",token,index[fg]);break;
            case 32:printf("** %s-->%s **\n",token,index[fg]);break;
            case 33:printf("** %s-->%s **\n",token,index[fg]);break;
            case 34:printf("** %s-->%s **\n",token,index[fg]);break;
            case 35:printf("** %s-->%s **\n",token,index[fg]);break;
            case 36:printf("** %s-->%s **\n",token,index[fg]);break;
            case 37:printf("** %s-->%s **\n",token,index[fg]);break;
            case 39:printf("** %s-->%s **\n",token,index[fg]);break;
            case 40:printf("** %s-->%s **\n",token,index[fg]);break;

            case 41:printf("** %c-->%s **\n",toke,index[fg]);break;//字元

            case -1:printf("分析器不存在該詞法\n");  break;
        }
    }while(fg!=42);
    getch(); //用於讓程式停留在顯示頁面
}

scaner()
{//詞法掃描程式
    int m=0;//token[]下標
    int n;
    toke=NULL;
    //清空token[]
    for(n=0;n<5;n++)
        token[n]=NULL;
    //獲取第一個不為0字元
    ch=input[p++];
    while(ch==' ')ch=input[p++];
    while(ch=='\n')ch=input[p++];

    //數字處理
    if(ch<='9'&&ch>='0')
    {
        num=0;
        while(ch<='9'&&ch>='0')
        {
            num=num*10+ch-'0';
            ch=input[p++];
        }
        ch=input[--p];
        fg=1;
    }

    //關鍵字處理/識別符號處理
    else if((ch<='z'&&ch>='a')||(ch<='Z'&&ch>='A')||(ch=='_'))
    {
        int flag=0;
        while((ch<='z'&&ch>='a')||(ch<='Z'&&ch>='A')||(ch<='9'&&ch>='0')||(ch=='_'))
        {
            token[m++]=ch;
            ch=input[p++];
        }
        token[m++]='\0';
        ch=input[--p];

        for(n=0;n<14;n++)//關鍵字
        {
            if(strcmp(token,character[n])==0)//strcmp()比較兩個字串,相等返回0
            {
                flag=1;
                fg=n+3;
                break;

            }
       }
       if(flag==0)
       {
            fg=0;
       }
    }
    //運算子分界符處理
    else
    {
        switch(ch)
        {
            case '+':
                m=0;
                token[m++]=ch;
                ch=input[p++];
                if(ch=='+')          //產生++
                {
                    fg=22;
                    token[m++]=ch;
                }
                else     //產生+
                {
                    fg=17;
                    ch=input[--p];
                }
                break;

            case '-':
                m=0;
                token[m++]=ch;
                ch=input[p++];
                if(ch=='-')          //產生--
                {
                    fg=23;
                    token[m++]=ch;
                }
                else     //產生-
                {
                    fg=18;
                    ch=input[--p];
                }
                break;

            case '>':
                m=0;
                token[m++]=ch;
                ch=input[p++];
                if(ch=='=')          //產生>=
                {
                    fg=29;
                    token[m++]=ch;
                }
                else     //產生>
                {
                    fg=28;
                    ch=input[--p];
                }
                break;


            case '<':
                m=0;
                token[m++]=ch;
                ch=input[p++];
                if(ch=='=')          //產生<=
                {
                    fg=31;
                    token[m++]=ch;
                }
                else     //產生<
                {
                    fg=30;
                    ch=input[--p];
                }
                break;

            case '=':
                m=0;
                token[m++]=ch;
                ch=input[p++];
                if(ch=='=')          //產生==
                {
                    fg=32;
                    token[m++]=ch;
                }
                else     //產生=
                {
                    fg=27;
                    ch=input[--p];
                }
                break;

            case '!':
                m=0;
                token[m++]=ch;
                ch=input[p++];
                if(ch=='=')          //產生!=
                {
                    fg=33;
                    token[m++]=ch;
                }
                else     //產生!
                {
                    fg=24;
                    ch=input[--p];
                }
                break;

            case '&':
                m=0;
                token[m++]=ch;
                ch=input[p++];
                if(ch=='&')          //產生&&
                {
                    fg=25;
                    token[m++]=ch;
                }
                else     //無產生
                {
                    fg=41;
                    ch=input[--p];
                }
                break;

            case '|':
                m=0;
                token[m++]=ch;
                ch=input[p++];
                if(ch=='|')          //產生||
                {
                    fg=26;
                    token[m++]=ch;
                }
                else     //無產生
                {
                    fg=41;
                    ch=input[--p];
                }
                break;

            case '*':fg=19;token[0]=ch;break;
            case '/':fg=20;token[0]=ch;break;
            case '%':fg=21;token[0]=ch;break;
            case ',':fg=34;token[0]=ch;break;
            case ':':fg=35;token[0]=ch;break;
            case ';':fg=36;token[0]=ch;break;
            case '(':fg=37;token[0]=ch;break;
            case ')':fg=38;token[0]=ch;break;
            case '{':fg=39;token[0]=ch;break;
            case '}':fg=40;token[0]=ch;break;

            case '"':
                ch=input[p++];
                m=0;
                token[m++]=ch;
                do
                {
                    ch=input[p++];
                    token[m++]=ch;
                }while(ch!='"');
                fg=2;
                break;
            case '\'':
                ch=input[p++];
                m=0;
                toke=ch;
                do
                {
                    ch=input[p++];
                    token[m++]=ch;
                }while(ch!='\'');
                if(token[0]=='\'')
                {
                    fg=41;
                }
                else
                {
                    fg=-1;
                }
                break;

            case '#':fg=42;break;
            default:fg=-1;
        }
    }
}

完成！

一個簡單C語言的詞法分析器

一個簡單C語言的詞法分析器語言的詞法構成：識別符號 id 同C語言識別符號常量 num 數字 ch 字元 str 字串關鍵字 kw_int int kw_char char kw_void void kw_if

【編譯原理】利用Flex工具生成C語言詞法分析器

Flex構造C語言詞法分析器可以識別大部分的C語言關鍵字和識別符號，可以去除註釋（多行單行都可以），可以識別整數和浮點數，可以識別錯誤的浮點數。 lex檔案結構： [第一部分：定義段] /* *按照C語言語法，宣告檔案包含，巨集定義，常數定義，全域性

Python 實現的 C 語言詞法分析器

這個學期上了編譯原理課，真的是超難。。。這門課難到，全院老師只有我們老師他一個人會教編譯原理，哈哈哈哈這門課這個學期有兩個實驗，一個是寫詞法分析器，一個是寫語法分析器這裡的詞法分析器是用 Python 寫。Python 是剛自學的，所以使用上應該

LEX & FLEX 實現C語言詞法分析器

最近在學習《編譯原理》，學完詞法分析之後，做了一個C語言的詞法分析器。詞法分析簡述：詞法分析是編譯過程的第一步，主要實現高階語言程式中詞法規範的檢查。詞法分析程式的主要任務是按語言的詞法規則從源程式中逐個識別單詞，把字串形式的源程式轉行成單詞串的形式，並把每個單詞轉換

編譯原理：C語言詞法分析器

編譯原理的實驗：完成對C語言的詞法分析先說一下整體框架：基類：Base 封裝了一些基礎的字元判斷函式，如下： int charkind(char c);//判斷字元型別 int spaces(char c); //當前空格是否可以消除 int characte

【編譯原理】類C語言詞法分析器的設計

1.實驗要求輸入為一個以類C語言編寫的源程式輸出為一組二元組序列構成的文字檔案，一行為一個二元組，二元組中間以逗號隔開實驗報告上要求附上DFA 2.語言說明：保留字：unsigned、break、return、void、case、float、char、for、while、co

編譯原理之手工構造C語言詞法分析器

編寫一個（C語言）詞法分析器：需求是：1對原來的資料進行預處理，刪掉註釋；（為了展示方便，就不刪掉換行，製表符了，本來應該是要刪掉這些的）2將詞法正確的token分解出來，一共應該有5類，識別符號，關鍵字，常數，界符，運算子，對於原來的原始碼，將token之間都加上空格；3對

一個簡單c#爬蟲程序

count www 數據排名其他瀏覽器 pytho 分享很多 attr 這篇文章只是簡單展示一個基於HTTP請求如何抓取數據的文章，如覺得簡單的朋友，後續我們再慢慢深入研究探討。圖1：如圖1，我們工作過程中，無論平臺網站還是企業官網，總少不了新聞展示。

一個資深C語言工程師說如何學習C語言

談及C語言，我想凡是學過它的朋友都有這樣一種感覺，那就是“讓我歡喜讓我憂。”歡喜的是，C語言功能非常強大、應用廣泛，一旦掌握了後，你就可以理直氣壯地對他人說“我是電腦高手！”，而且以後若是再自學其他語言就顯得輕而易舉了。憂慮的是，C語言猶如“少林武功”一般博大精深，太難學了。其實就筆者認為

基於C++的詞法分析器

實驗目的通過設計編制除錯一個具體的詞法分析程式，加深對詞法分析原理的理解。並掌握在對程式設計語言源程式進行掃描過程中將其分解為各類單詞的詞法分析方法。編制一個讀單詞過程，從輸入的源程式中，識別出各個具有獨立意義的單詞(token)，即基本保留字、識別符號、常量、運算子、分隔符五大類，並依

小C語言--詞法分析程式

小C語言文法 1. <程式>→(){<宣告序列><語句序列>} 2. <宣告序列>→<宣告序列><宣告語句>|<宣告語句>|<空> 3. <宣告語句>→<識別符

編譯原理小C語言--詞法分析程式

Problem Description 小C語言文法 1. <程式>→(){<宣告序列><語句序列>} 2. <宣告序列>→<宣告序列><宣告語句>|<宣告語句>|<空> 3.

一個簡單C++躲避子彈遊戲

Hello guys,This is very simple and one of my old projects I've created.It's probably the best one,as it really looks like a game,mind you the co

樹莓派跑一個簡單c++小程式教程

我用的是樹莓派3代b型，所使用的是Debian系統的衍生系統raspbian(對系統不太瞭解不清楚)。樹莓派開發c++程式需要的工具有編輯器vim,偵錯程式gdb,編譯器gcc或者g++.（大神飄過就行~~ 記錄一下）用紅筆塗得地方是我命令敲錯的地方，大家忽略就行。安裝vim 執行

一個學習C語言的好網站，推薦給大家

你是否在疑問“C語言學習完了以後該怎麼深入學習？” 你是否在疑惑“怎麼學了一年的C語言還是什麼都不會寫？” 你是否在迷茫“C、Java、C#……一大堆語言，我學哪個才能對以後就業有幫助？” 來學《C語言也能幹大事》吧，它將解除你內心的疑惑，伴你走上成功之路。所有視訊、板書都

用弦截法求函式的一個根(c語言描述)

一個考驗c語言和資料結構功底的小專案

想測一下自己c語言學習水平的朋友可以做一下這個專案試試，能做出來說明c語言已經入門了 #include<stdio.h> #include<stdlib.h> #include<string.h> type

一個簡單C順序棧的實現

僅用於記錄，加深理解的練習。水平有限，不規範之處還請包涵指正。只實現了初始化棧，進棧，出棧，列印資料功能。 #include<stdio.h> #include<stdlib.h> #define ADDSIZE 10 #

自己動手實現一個簡單c編譯器

這學期的編譯課程設計需要做一個類c編譯器，準確的說是完善上學期做的大實驗。上學期的實驗中，使用antlr完成的編譯器識別的語法很有限，基本上是個計算器的語法，於是這次決定弄語法一個更加完整。語法支援：宣告，賦值，函式,if-else,while,for。首先是詞法分

編寫一個刪除C語言程式中所有註釋語句的程式

#include <stdio.h> void rcomment (int c); void in_comment_one (void); //該函式用於處理/*及*/的註釋符 voi

一個簡單C語言的詞法分析器

一個簡單C語言的詞法分析器

相關推薦