Chỉ thị tiền xử lý trong C/C++

      Bên cạnh các từ khoá thường dùng, C/C++ có 1 số lệnh tiền xử lí, những lệnh này không bao giờ được biên dịch thành bất kì dòng lệnh nào trong mã thực thi. Thay vào đó nó có ảnh hưởng đến các khía cạnh của quy trình biên dịch. Ví dụ, ta có thể dùng chỉ dẫn tiền xử lí để ngăn trình biên dịch biên dịch một phần đoạn mã nào đó. Chỉ thị tiền xử lí được phân biệt bằng cách bắt đầu với dấu #. Chỉ thị tiền xử lý không phải là lệnh C/C++ vì vậy không có dấu “;” khi kết thúc. Bài viết này sẽ giúp bạn hiểu rõ hơn vấn đề này.

Chỉ thị tiền xử lý (preprocessor directives)

      Chỉ thị tiền xử lý là những chỉ thị cung cấp cho trình biên dịch để xử lý những thông tin trước khi bắt đầu quá trình biên dịch. Tất cả các chỉ thị tiền xử lý đều bắt đầu với với # và các chỉ thị tiền xử lý không phải là lệnh C/C++ vì vậy không có dấu ; khi kết thúc. Để cho dễ chúng ta chia thành 3 nhóm chính đó là:

  • Chỉ thị bao hàm tệp (#include).
  • Chỉ thị định nghĩa cho tên (#define macro).
  • Chỉ thị biên dịch có điều kiện (#if, #else, #elif, #endif, …).
Chỉ thị bao hàm tệp (#include)

      Ở nhóm này chỉ có một chỉ thị đó là #include.

      Đây là chỉ thị cho phép chúng ta include một file khác vào file chúng ta đang viết.

      Cú pháp 1:

#include <file_name>

      Với cú pháp 1, bộ tiền xử lý sẽ tìm file_name có sẵn trong IDE(như Visual Studio) của bạn và chèn vào file mà chúng ta đang viết, nếu tìm không thấy file_name thì trình biên dịch sẽ báo lỗi. Các file có sẵn trong IDE như stdio.h, math.h, conio.h, ….

      Ví dụ:

#include <stdio.h>

      Cú pháp 2:

#include “file_name”

      Khi sử dụng cú pháp 2, bộ tiền xử lý sẽ tìm file_name trong các thư mục trên máy tính của chúng ta, khi tìm không thấy thì tiếp tục tìm trong các file có sẵn trong IDE. Nếu tìm được file_name thì chèn file_name vào file đang thao tác, còn vẫn không tìm thấy file_name thì trình biên dịch sẽ báo lỗi.

      Ví dụ:

#include “GPIO.h”

      Để hiểu bạn hình dung rõ hơn về cơ chế hoạt động của chỉ thị #include thì bạn theo dõi ví dụ sau đây.

      Tôi có file GPIO.h có nội dung như sau:

struct PORT

{

int Pin;

boolean State;

};

Trong file main.cpp tôi muốn sử dụng struct PORT thì tôi phải #include “GPIO.h”.

//main.cpp

#include “GPIO.h”

int main()

{

struct PORT 1;

return 0;

}

      Việc #include “GPIO.h” giống như việc chép tất cả các đoạn code trong file GPIO.h vào file main.cpp.

struct PORT

{

int Pin;

boolean State;

};

int main()

{

struct PORT 1;

return 0;

}

Chỉ thị định nghĩa cho tên (#define macro) 

      Ở nhóm này gồm các chỉ thị #define, #undef.

      Chỉ thị #define

      Chỉ thị #define không có đối số.

      Cú pháp:

#define identifier replacement-list

      Chỉ thị này có tác dụng thay thế tên (identifier) bằng một dãy kí tự sau nó, khi dãy kí tự thay thế quá dài và sang dòng mới thì có thể sử dụng dấu \ vào cuối dòng trước.

      Ví dụ:

#define TAPIT “tapit.vn” // định nghĩa cho TAPIT

      Trong hàm main ta thực hiện lệnh sau:

printf(TAPIT); // tương đương với lệnh printf(“tapit.vn”);

      Phạm vi của tên được định nghĩa bởi #define là lúc từ khi nó được định nghĩa cho đến cuối tệp.

      Có thể dùng #define định nghĩa như tên hàm, một biểu thức, một đoạn chương trình bằng một tên, với cách sử dụng này thì chương trình của chúng ta sẽ ngắn gọn và dễ hiểu hơn.

      Ví dụ:

#define output printf(“tapit.vn”);

      Trong hàm main tôi thực hiện câu lệnh sau:

output;  // printf(“tapit.vn”);

      Những điểm cần chú ý của chỉ thị #define cho cách sử dụng trên:

  • Khi định nghĩa một biểu thức ta nên đặt nó trong trong cặp dấu ngoặc tròn.

      Ví dụ:

#define SUM 5+8

      Khi ta gán size = SUM không xảy ra vấn đề gì nhưng khi gán size = 5*SUM thì tương đương với size = 5*5+8 chứ không phải là size = 5*(5+8) như ta mong muốn. Vì thế nên ta dùng #define SUM(5+8)sẽ luôn đúng trong mọi trường hợp.

  • Khi định nghĩa đoạn chương trình gồm nhiều câu lệnh thì ta nên đặt trong cặp ngoặc { và }.

      Ví dụ:

#define HELLO { printf(“Hello TAPIT\n”); printf(“tapit.vn”); }

void main()

{

bool x = true;

if(x) HELLO;

}

      Đoạn chương trình trên khi biên dịch sẽ theo như mong muốn của ta là khi x = true in ra màn hình:

Hello TAPIT

tapit.vn

      Khi gán x = false thì không in ra màn hình.

      Nhưng khi ta bỏ ngoặc { và } thì đoạn code sẽ như sau:

#define HELLO  printf(“Hello TAPIT\n”); printf(“tapit.vn”);

      Thì ngay cả khi x = false thì vẫn in ra màn hình:

tapit.vn

      Chỉ thị #define có đối số.

      Ngoài cách sử dụng #define như trên, chúng ta còn có thể dùng #define để định nghĩa các macro có đối giống như hàm. Để rõ hơn thì bạn theo dõi ví dụ định nghĩa một macro tính tổng của 2 giá trị.

#define SUM(x,y) (x)+(y)

      Khi đó câu lệnh

int z = SUM(x*2, y*3);

      Được thay bằng

int z = (x*2) + (y*3);

      Các điểm cần lưu ý:

  • Giữa macro và dấu ( không được tồn tại khoảng trắng.
  • Để tránh rủi ro không mong muốn thì khi viết các biểu thức định nghĩa cho macro, các đối tượng hình thức (như x và y ở ví dụ trên) thì nên có cặp ngoặc ( và ) bao quanh. Để minh họa cho điều này thì ta đến với ví dụ sau:

#define MUL(x,y) x*y

void main()

{

printf(“%d”, MUL(5+3, 10));

}

Khi đó trình biên dịch thay MUL(5+3, 10) bằng 5+3*10 và ta nhận đáp án 35 thay vì 80 như ta mong muốn.

Chỉ thị #undef

      Cú pháp:

#undef identifier 

      Khi ta cần định nghĩa lại một tên mà ta đã định nghĩa trước đó thì ta sử dụng #undef để hủy bỏ định nghĩa đó và sử dụng #define định nghĩa lại cho tên đó.

      Ví dụ:

#define TAPIT “Hello TAPIT ” // Định nghĩa cho tên TAPIT là “Hello TAPIT “

#undef TAPIT // Hủy bỏ định nghĩa cho tên TAPIT

#define TAPIT “Welcome to TAPIT ” // Định nghĩa lại cho tên TAPIT là “Welcome to TAPIT “

Chỉ thị biên dịch có điều kiện

      Ở nhóm này gồm các chỉ thị #if, #elif, #else, #ifdef, #ifndef.

      Các chỉ thị #if, #elif, #else.

      Cú pháp:

#if constant-expression_1

// Đoạn chương trình 1

#elif  constant-expression_2

// Đoạn chương trình 2

#else

//Đoạn chương trình 3

#endif

      Nếu constant-expression_1 true thì chỉ có đoạn chương trình 1 sẽ được biên dịch, trái lại nếu constant-expression_1 false thì sẽ tiếp tục kiểm ta đến constan-expression_2. Nếu vẫn chưa đúng thì đoạn chương trình trong chỉ thị #else được biên dịch .

      Các constant-expression là biểu thức mà các toán hạng trong đó đều là hằng, các tên đã được định nghĩa bởi các #define cũng được xem là các hằng.

      Các chỉ thị #ifdef, #ifndef.

      Một cách biên dịch có điều kiện khác đó là sử dụng #ifdef và #ifndef, được hiểu như là Nếu đã định nghĩa và Nếu chưa được định nghĩa.

      Chỉ thị #ifdef.

#ifdef identifier

//Đoạn chương trình 1

#else

//Đoạn chương trình 2

#endif

      Nếu indentifier đã được định nghĩa thì đoạn chương trình 1 sẽ được thực hiện. Ngược lại nếu indentifier chưa được định nghĩa thì đoạn chương trình 2 sẽ được thực hiện.

      Chỉ thị #indef

#ifndef identifier

     //Đoạn chương trình 1

#else

     //Đoạn chương trình 2

#endif

      Với chỉ thị #ifndef thì cách thức hoạt động ngược lại với #ifdef.

      Ví dụ:

#ifdef    MAX // Nếu MAX đã được định nghĩa

         #undef MAX // Hủy bỏ MAX

         #define MAX 100 // Định nghĩa lại MAX

#else // Nếu MAX chưa được đinh nghĩa

         #define MAX 1 // Định nghĩa MAX

#endif

       Các chỉ thị điều kiện ở trên, thường được sử dụng cho việc xử lý xung đột thư viện khi chúng ta #include nhiều thư viện như ở ví dụ dưới đây:

      Tôi có một file A.h.

//file A.h

Source code B

      Tôi cũng có các file B.h và C.h và 2 file này đều cần nội dung của file A.h, vì thế tôi #include “A.h” vào file B.h và C.h.

//file B.h

#include”A.h”

Source code B

//file C.h

#include”A.h”

Source code C

      File main.cpp của tôi #include “B.h” và #include “C.h”, khi đó nội dụng file main.cpp trở thành.

//file main.cpp

#include”B.h”

#include”C.h”

Source code file main

      Chúng ta có thể hình dung file main.cpp như sau:

//file main.cpp

//#inlude”B.h”

Source code A

Source code B

  //#include”C.h”

Source code A

Source code C

Source code file main

      Như ta thấy nội dung file A.h sẽ được chép 2 lần sang file main.cpp, bởi vì khi ta #include “B.h” thì nội dung file B.h(có cả nội dung file A.h) đã được chép sang file main.cpp. Ta tiếp tục #include “C.h” thì nội dung file C.h (có cả nội dung file A.h) đã được chép sang file main.cpp. Vì thế, nội dung của file A.h được chép 2 lần trong file main.cpp và khi ta biên dịch thì trình biên dịch sẽ báo lỗi. Để khắc phục lỗi này thì tôi sử dụng chỉ thị #ifndef, #define vào trong file A.h.

#ifndef __A_H__

#define __A_H__

Source code A

#endif // __AH__

      Khi đó nội dung file main.cpp chúng ta có thể hình dung là:

//file main.cpp

//#include”B.h”

#ifndef __A_H__

#define __A_H__

Source code A

#endif // __AH__

  Source code B

//#include”C.h”

#ifndef __A_H__

#define __A_H__

Source code A

#endif // __AH__

  Source code C

Source code file main

      Cơ chế hoạt động:

  • Từ dòng 4-9: __A_H__ chưa được định nghĩa nên cho phép chép nội dung file A.h vào main.cpp.
  • Dòng 11: Nội dung file B.h.
  • Từ dòng 14-19: Ở trên __A_H__ đã được định nghĩa nên không cho phép chép nội dung file A.h vào main.cpp.
  • Dòng 21: Nội dung file C.h.

Nguồn sưu tầm: Stdio

HUỲNH NGỌC THƯƠNG