[編譯原理-詞法分析(一)] 輸入緩衝雙緩衝區方案

阿新 • • 發佈：2019-09-25

前言

在實踐中, 通常需要向前看一個字元. 
比如, 當讀到一個 非字母或數字的字元 時才能確定已經讀到一個識別符號的結尾. 因此, 這個字元不是id詞素的一部分. 
採用雙緩衝區方案能夠安全地處理向前看多個符號的問題. 然後, 將考慮一種改進方案, 使用"哨兵標記"來節約用於檢查緩衝區末端的時間. {P72}

前情提要

一、緩衝區對
二、哨兵標記
三、實現雙緩衝區

正文

一、緩衝區對

描述:
    兩個交替讀入的緩衝區, 容量為N個字元, 使用系統命令一次性將N個字元讀入到緩衝區;
    如果輸入字元不足N個, 則有特殊字元EOF來標記檔案結尾;
    程式維護兩個指標lexemeBegin和forward;
    lexemeBegin指向當前詞素的開始處, 當前正試圖確定這個詞素的結尾;
    forward向前掃描, 直到與某個模式匹配為止;
    當確定該詞素時, forward指向該詞素結尾的字元;
    將詞素作為摸個返回給語法分析器的詞法單元的屬性值記錄;
    lexemeBegin指向該詞素後的第一個字元, 然後將forward左移一個字元;
    在forward不斷掃描中, 檢查是否掃描到EOF, 如果是則將N個新字元讀入另外一個緩衝區, 且將forward指向緩衝區頭部;

二、哨兵標記

當採用雙緩衝區方案, 那麼每次向前移動forward指標時, 都需要檢查是否到緩衝區結尾, 若是則載入另外一個緩衝區.
如果擴充套件每個緩衝區, 使它們在末尾包含一個哨兵(sentinel)字元, 就可以把緩衝區末尾的測試和當前字元的測試結合在一起, 這個字元選擇不會出現在源程式中的 EOF標記.

三、實現雙緩衝區

將使用<~> 標記來自哪個檔案

<~Buffer.h>

namespace Lexical_Analysis {

    template <int size = 1024>
    class Buffer {
    private:
        enum Tag { ONE, TWO }; // 緩衝區標號
    public:
        explicit Buffer(std::string _fileStr);
        ~Buffer() noexcept;

    public:
        std::string fileStr; // 檔案路徑
        std::ifstream fileStream; // 檔案流

        char* lexemeBegin = nullptr;
        char* forward = nullptr;

        char buffer_1[size];
        char buffer_2[size];

        Buffer::Tag bufferTag = Tag::ONE; // 哪個緩衝區

        /**
         * @return 返回lexemeBegin 與 forward 的字元序列
         */
        std::string getString();

        /**
         * 從fileStream流讀取字元序列
         */
        void read();

        /**
         * forward向前移動一個字元
         * @return 返回當前字元
         */
        char next();
    };
};

<~Buffer_TailAffix.h>

namespace Lexical_Analysis {

    template<int size>
    Buffer<size>::Buffer(std::string _fileStr):fileStr(std::move(_fileStr)) {
        fileStream.open(fileStr);

        buffer_1[size - 1] = EOF;
        fileStream.read(buffer_1, size - 1);

        lexemeBegin = forward = &buffer_1[0];
    }

    template<int size>
    Buffer<size>::~Buffer() noexcept {
        if (fileStream) {
            fileStream.close();
        }
    }

    template<int size>
    std::string Buffer<size>::getString() {
        std::stringstream ss;

        char* current = lexemeBegin;
        while (current != forward) {

            if (*current == EOF) {
                if (bufferTag == Tag::ONE) {
                    current = &buffer_1[0];
                } else if (bufferTag == Tag::TWO) {
                    current = &buffer_2[0];
                }
            }
            ss << *current++;
        }

        return ss.str();
    }

    template<int size>
    void Buffer<size>::read() {
        if (!fileStream) return ;

        /**
         * bufferTag 為當前從檔案流讀入的緩衝區標號
         * 將每個緩衝區的末尾設定為 哨兵標記
         */
        if (bufferTag == Tag::ONE) {
            // 當前在第一個緩衝區末尾, 裝載第二個緩衝區
            buffer_2[size - 1] = EOF;
            fileStream.read(buffer_2, size - 1);
            // 設定Tag為第二個緩衝區, 並且設定forward為第二個緩衝區的開頭
            bufferTag = Tag::TWO;
            forward = &buffer_2[0];
        } else if (bufferTag == Tag::TWO) {
            // 當前在第二個緩衝區末尾, 裝載第一個緩衝區
            buffer_1[size - 1] = EOF;
            fileStream.read(buffer_1, size - 1);
            // 設定Tag為第一個緩衝區, 並且設定forward為第一個緩衝區的開頭
            bufferTag = Tag::ONE;
            forward = &buffer_1[0];
        }
    }

    template<int size>
    char Buffer<size>::next() {
        char c = *forward;

        if (c == '\0') {
            // 終止詞法分析
            return '\0';
        }

        if (c == EOF) {
            // 已到緩衝區末尾標記
            read();
        }

        return *forward++;
    }

};

尾記

只要從不需要越過實際詞素向前看很遠, 以至於這個詞素的長度加上向前看的距離大於N,就決不會識別這個詞素之前覆蓋尚在緩衝區的詞素 {P72}

lexemeBegin指標在第一個緩衝區, 而forward指標已經指向第二個緩衝區的EOF. 當forward向前移動一個字元時, 需要切換緩衝區, 這樣會導致將第一個緩

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    [編譯原理-詞法分析(一)] 輸入緩衝 雙緩衝區方案
      
                                        
                                                前言
在實踐中, 通常需要向前看一個字元. 
比如, 當讀到一個 非字母或數字的字元 時才能確定已經讀到一個識別符號的結尾. 因此 

  
 

    

    
    編譯原理 詞法分析 一
       
 
 轉發自： 作者：jzyhywxz  來源：CSDN  原文：https://blog.csdn.net/jzyhywxz/article/details/78285722  版權宣告：本文為博主原創文章，轉載請附上博文連結！ 
     本文是詞法分 

  
 

    

    
    編譯原理----詞法分析
       
 
 0.PL/0文法   
 〈程式〉→〈分程式〉. 
 〈分程式〉→ [<常量說明部分>][<變數說明部分>][<過程說明部分>]〈語句〉 
   
  <常量說明部分> → CONST<常量定義>{  

  
 

    

    
    編譯原理——詞法分析（1）
      
								
								            
						
                在我們學習詞法分析時，就會思考如何構造一個詞法分析器？
一個詞法分析器可以通過手工構造；也可以通過以下方式自動生成一個詞法分析器：向一個詞法分析器生成工具描述出詞素的模式，然後將這些模式編譯為具有動詞分 

  
 

    

    
    編譯原理——詞法分析（2）
      
                

1.1串和語言

       字母表是一個有限的符號集合。符號的典型例子包括字母、數位和標點符號。如集合{0，1}是二進位制字母表。

某個字母表的串(string)是該字母表符號的有窮序列，空串是長度為0的串。

語言(language)：是某個給定字元表上任意的可數 

  
 

    

    
    編譯原理-詞法分析
      
							
							
							實驗內容
通過對PL/0詞法分析程式（GETSYM）的分析，並在此基礎上按照附錄A中給出的PL/0語言的語法描述，編寫一個PL/0語言的詞法分析程式。此程式應具有如下功能：
輸入為字串（待進行詞法分析的源程式），輸出為單詞串，即由（單詞、類別）所組成的二元組序列 

  
 

    

    
    編譯原理 語法分析 一
       
 
 詞法分析器把源程式轉換成了一個詞素序列，它讓我們知道了一個符號序列’i’、’f’是一個關鍵詞”if”，而一個符號序列’1’、’2’、’3’、’4’是一個常量”1234”等等。但是，詞法分析器的工作也到此為止了，它不能說明幾個詞素之間的關係。例如，對於詞素串”int”、”x”、”=”、”1”、”;”， 

  
 

    

    
    編譯原理 詞法分析三
       
 
 本文是詞法分析的第三篇文章。之前的第一篇文章介紹了詞法單元、模式和詞素的三者間的關係，以及正則表示式；第二篇文章介紹了有窮自動機，以及如何把NFA轉換成等價的DFA。本文首先將介紹如何把一個正則表示式轉換成一個有窮自動機，接著會給出一個最小化DFA狀態數的演算法，最後會回顧整個詞法分析過程。 
 從 

  
 

    

    
    編譯原理 詞法分析 二
       
 
 上一篇文章我們介紹了在詞法分析中涉及到的詞法單元、模式和詞素的概念，並給出了正則表示式的遞迴定義，以及如何把一個正則表示式轉換成一個狀態轉換圖。本篇文章將接著上一篇文章的內容，繼續介紹詞法分析的一個重要內容——有窮自動機。 
 有窮自動機 一個有窮自動機可以把一個描述詞素的模式變成一個詞法分析器，從 

  
 

    

    
    編譯原理——詞法分析程式
      
							
							
							
  前言：這是我學習編譯原理，課程實驗的內容，課程早已結束，現整理髮表。




一、實驗任務


閱讀已有編譯器的經典詞法分析源程式；
用C或JAVA語言編寫一門語言的詞法分析器。






二、實驗內容


閱讀已有編譯器的經典詞法分析源程式。 
選擇一 

  
 

    

    
    編譯原理  詞法分析 原始碼
      
                #include<iostream>#include<string>#include<fstream>#include<vector>// C++中的一種資料結構,確切的說是一個類.它相當於一個動態的陣列,當程式設計師無法知道自 

  
 

    

    
    編譯原理-詞法分析總結
      
                課程總結第三章詞法分析我認為是比較難理解的一章。本文主要介紹在詞法分析過程中需要用到的一些基本概念，包括詞法單元、模式和詞素以及三者之間的關係，理解這些內容對學習詞法分析過程十分重要。首先要了解詞法分析的任務。詞法分析的任務：從左至右逐個字元的對源程式進行掃描，產生一個個的單 

  
 

    

    
    編譯原理-詞法分析-語法分析-語義分析生成中間程式碼-python版
      
                
# -*- coding:UTF-8 -*-
#!/usr/bin/python
import string
import sys
import Analyze_2
Identifier=['if','else','for','while','do','int','writ 

  
 

    

    
    [編譯原理-詞法分析(二)] 使用狀態轉換圖識別詞法單元
      
                                        
                                                前言
一個小Demo, 用於分析的原始檔比較簡單, 主要的部分都有, 擴充套件比較容易.
將正則表示式表示的模式構造為狀態轉換圖. 

  
 

    

    
    #編譯原理# 詞法分析（三）第一部分
      詞法分析
編譯原理筆記第三部分，內容參考：北航軟院教師邵兵課堂課件及內容、張莉著《編譯原理及編譯程式構造》、國防工業出版社的《編譯原理——學習指導與典型題解析》、AlvinZH的學習筆記以及個人理解
目前是包含了全部內容的版本，後續會推出精簡版和複習知識點版
如有建議或錯誤錯誤歡迎在評論中指出或聯絡我：QQ： 

  
 

    

    
    #編譯原理# 詞法分析（三）第二部分
      詞法分析
編譯原理筆記第三部分，由於內容過長所以分為了兩部分，跳轉連結在總閱讀目錄處，內容參考：北航軟院教師邵兵課堂課件及內容、張莉著《編譯原理及編譯程式構造》、國防工業出版社的《編譯原理——學習指導與典型題解析》、AlvinZH的學習筆記以及個人理解
目前是包含了全部內容的版本，後續會推出精簡版和複習知識點 

  
 

    

    
    編譯原理實驗報告一：PL0語言編譯器分析（PL0，詞法分析，語法分析，中間程式碼生成）
      
                實驗報告一：PL0語言編譯器分析一、實驗目的       通過閱讀與解析一個實際編譯器（PL/0語言編譯器）的原始碼， 加深對編譯階段（包括詞法分析、語法分析、語義分析、中間程式碼生成等）和編譯系統軟體結構的理解，並達到提高學習興趣的目的。二、實驗要求(1)   要求掌握基本 

  
 

    

    
    編譯原理實驗（一）之詞法分析
       
 
 
 詞法分析 
 (1)參考附錄1設計一個簡單語言的詞法分析程式，要求能夠處理註釋、換行回車、部分複合運算子（如>=）。 
 (2)設計並實現含多條簡單賦值語句的語法分析程式，要求有一定的出錯提示與錯誤恢復功能。    (參考附錄2) 
 附錄1: 
 例C源程式段：
ma 

  
 

    

    
    詞法分析器——哈工大編譯原理課程（一）
      mina   ==   原理   技術分享   after   文件   編碼   exe   warn   詞法分析器——哈工大編譯原理課程（一）


程序輸入：從code.txt文件中讀取內容
程序輸出：識別出的單詞序列，格式為：（種別碼，屬性值）
　　　　　①對於關鍵字 

  
 

    

    
    編譯原理->詞法分析器的分析
      > -> >=四、然後對於詞法分析器來說，我們就是要將物件語言的語法全部描述出來，下面就以C語言為例來說明問題：（1）關鍵字： main if else int return void while ...所有的關鍵字都是小寫。（2）專用符號= + - * / <= >= >

[編譯原理-詞法分析(一)] 輸入緩衝雙緩衝區方案

前言

前情提要

正文

一、緩衝區對

二、哨兵標記

三、實現雙緩衝區

尾記

[編譯原理-詞法分析(一)] 輸入緩衝雙緩衝區方案

編譯原理詞法分析一

編譯原理----詞法分析

編譯原理——詞法分析（1）

編譯原理——詞法分析（2）

編譯原理-詞法分析

編譯原理語法分析一

編譯原理詞法分析三

編譯原理詞法分析二

編譯原理——詞法分析程式

編譯原理詞法分析原始碼

編譯原理-詞法分析總結

編譯原理-詞法分析-語法分析-語義分析生成中間程式碼-python版

[編譯原理-詞法分析(二)] 使用狀態轉換圖識別詞法單元

#編譯原理# 詞法分析（三）第一部分

#編譯原理# 詞法分析（三）第二部分

編譯原理實驗報告一：PL0語言編譯器分析（PL0，詞法分析，語法分析，中間程式碼生成）

編譯原理實驗（一）之詞法分析

詞法分析器——哈工大編譯原理課程（一）

編譯原理->詞法分析器的分析

[編譯原理-詞法分析(一)] 輸入緩衝 雙緩衝區方案

前言

前情提要

正文

一、緩衝區對

二、哨兵標記

三、實現雙緩衝區

尾記

相關推薦

[編譯原理-詞法分析(一)] 輸入緩衝雙緩衝區方案