Compiler là gì?

Compiler là gì?
Muốn máy tính nhanh chóng hiểu và thực thi các câu lệnh, thì quá trình Compiler trong chương trình là điều không thể thiếu.

Compiler là gì?

Compiler còn được gọi là trình biên dịch hay phần mềm biên dịch, đây là trình dịch có khả năng đọc các chương trình được viết bằng các ngôn ngữ cấp cao, tiếp đó biến đổi nó sang ngôn ngữ hay ngôn ngữ cấp thấp. Đồng thời, thực hiện báo cáo các lỗi đang tồn tại trong chương trình.

Ngoài ra, compiler còn đảm nhận trọng trách chuyển đổi mọi mã nguồn trong một lần, hoặc thực hiện quy trình này nhiều lần, nhằm mang lại cho người dùng một mã đã qua biên dịch và sẵn sàng để thực thi.

Trong Compiler, các công việc thường được chia thành hai giai đoạn chính:

  • Giai đoạn phân tích: Đây là giai đoạn đầu trong Compiler, lúc này chương trình sẽ được chia thành các phần cấu thành cơ bản và thực hiện kiểm tra ngữ pháp, ngữ nghĩa và cú pháp của mã, khi đã tạo mã trung gian. 
  • Giai đoạn tổng hợp: Nếu như giai đoạn phân tích được coi là phần đầu, thì giai đoạn tổng hợp chính là phần cuối trong Compiler. Ở giai đoạn này, mã trung gian sẽ được tối ưu hóa, đồng thời tạo ra mã đích.

Compiler là gì?

Công việc cụ thể trong compiler

Trong hoạt động của compiler, thường phải trải qua 6 công việc chính như:

  • Phân tích từ vựng: Đây là giai đoạn đầu trước khi compiler tiến hành quét mã nguồn, chức năng chính ở giai đoạn này thường là:
    • Xác định các đơn vị từ vựng trong source.
    • Phân loại các đơn vị từ trong class theo từng phần như hằng, từ khóa riêng và xếp chúng vào từng bảng khác nhau. Việc này sẽ giúp lược bỏ các comment trong chương trình nguồn.
    • Xác định một số mã thông báo không thuộc phần của ngôn ngữ.
  • Phân tích cú pháp: Nhiệm vụ của công việc này là khám phá mọi cấu trúc tồn tại trong bảng, đảm bảo mã nguồn được lập trình viên xây dựng chính xác. Công việc chủ yếu trong giai đoạn này bao gồm:
    • Lấy mã thông báo từ trình phân tích từ vững.
    • Báo cao mọi lỗi cú pháp còn tồn tại.
    • Check lại biểu thức xem đã thỏa mãn về cú pháp hay chưa.
    • Xây dựng cấu trúc phân cấp hay cây nhị phân.
  • Phân tích ngữ nghĩa: Sử dụng kết hợp cây cú pháp của pha trước với bảng ký hiệu để khẳng định mã nguồn đang dùng phù hợp về mặt ngữ nghĩa. Ở giai đoạn này có chức năng:
    • Lưu trữ thông tin kiểu dữ liệu đã thu thập và lưu trữ nó trong bảng ký hiệu hay cây cú pháp.
    • Cho phép thực hiện kiểm tra kiểu dữ liệu.
    • Khi có bất kỳ kiểu dữ liệu nào không khớp, ngay lập tức lỗi ngữ nghĩa sẽ được hiển thị.
    • Tiến hành thu thập thông tin và check độ tương thích của kiểu dữ liệu.
    • Kiểm tra lại ngôn ngữ nguồn có sử dụng được toán hạng hay không.
  • Tạo mã trung gian: Sau quá trình phân tishc ngữ nghĩa sẽ có một mã trung gian được tạo ra hỗ trợ hoạt động cho máy đích. Hoạt động này diễn ra với một số công việc như:
    • Mã trung gian sẽ được tạo ra từ ngữ nghĩa trong chương trình nguồn.
    • Mọi giá trị tính toán trong compiler sẽ được giữ lại.
    • Hỗ trợ dịch mã trung gian sang ngôn ngữ đích.
    • Giúp nhà lập trình duy trì thứ tự ưu tiên trong ngôn ngữ nguồn.
    • Đảm bảo sự toàn vẹn của số toán hạng trong lệnh.
  • Tối ưu mã: Nhờ có giai đoạn này mà các mã không cần thiết được loại bỏ và sắp xếp lại các chuỗi trong câu lệnh, nhằm tăng tốc độ thực thi chương trình mà không làm lãng phí tài nguyên. Chức năng ở giai đoạn này thường là:
    • Thiết lập lại mối quan hệ giữa tốc độ thực thi với tốc độ biên dịch.
    • Xóa bỏ các câu lệnh không bị thay đổi khỏi vòng lặp.
    • Tăng tốc cho thời gian chạy trong chương trình đích.
    • Loại bỏ các mã không thể truy cập, cùng các biến không sử dụng đến.
  • Tạo mã: Đây là giai đoạn cuối cùng trong compiler, có chức năng chính là phân bổ lưu trưc và tạo ra các mã máy.

Compiler là gì?

Một số chức năng nổi bật trong compiler

Khi làm việc cùng compiler, nhà lập trình sẽ nhận được sự hỗ trợ từ một số chức năng nổi bật như:

  • Quá trình biên dịch sẽ được hỗ trợ theo từng cách riêng biệt.
  • Tất cả các mã và biến sẽ được quản lý lưu trữ trực tiếp trong máy.
  • Cho phép người dùng tạo cấu trúc ngay bên trong bộ nhớ.
  • Có khả năng kết nối các tệp thành một định dạng thực thi.
  • Hỗ trợ tối ưu hóa trong một số kiến trúc máy tính song song.
  • Người dùng hoàn toàn có thể sử dụng kết hợp cùng các Software Productivity Tools khác.
  • Nhanh chóng và dễ dàng dịch toàn bộ chương trình sang ngôn ngữ khác.
  • Quá trình biên dịch mã nguồn nhanh chóng được thực hiện, đồng thời phát hiện kịp thời các lỗi tồn tại trong mã nguồn.
  • Dễ dàng đọc, phân tích các chương trình tương đương về mặt ngữ nghĩa.
  • Check lỗi cú pháp và kiểu dữ liệu một cách linh hoạt.

Compiler là gì?

Lợi thế và hạn chế tồn tại trong compiler

Lợi thế

  • Không xảy ra tình trạng dịch ngược mã nguồn.
  • Compiler có độ tin cậy cao, cùng tính năng bảo mật tương đối tốt.
  • Hầu hết chương trình sẽ được thực thi nhanh chóng hơn ngôn ngữ thông dịch.
  • Hỗ trợ cả Multi-thread và Transaction.

Hạn chế

  • Khó thực hiện trên các nền tảng khác nhau.
  • Việc thực hiện một compiler với tính chính xác cao để dịch toàn bộ chương trình sang mã máy là điều không mấy dễ dàng.

Compiler là gì?