Monday, April 21, 2014

Introducation XML and JAXP

- XML parsers là chương trình giúp trích xuất và thao tác với dữ liệu trong một tài liệu XML.
- Lợi ích :

  1. Là một ngôn ngữ độc lập.
  2. Không phụ thuộc vào mã nguồn.
  3. Linh hoạt và phù hợp với hầu hết các ngôn ngữ.
- JAXP cung cấp một parsers để làm việc XML. Có 2 kỹ thuật phân tích dữ liệu XML là DOM và SAX:

  1. DOM: Document Object Model là một kỹ thuật tiếp cận dữ liệu theo hướng đối tượng. trong đó tất cả các thành phần của XML như thẻ, thuộc tính, text… đều được xem như là các đối tượng. Dựa vào các đối tượng này mà chúng ta có thể trích xuất thông tin, thay đổi thông tin hay truy vấn thông tin dựa vào các hàm mà đối tượng cung cấp. 
    1. Ưu điểm:
      • Dẽ dàng sử dụng và phân tích xml.
      • Có thể truy xuất ngầu nhiên.
      • Quản lí tốt dữ liệu phức tạp.
    2. Nhược điểm:
      • Việc đọc chỉ được thực hiện 1 lần tốn thời gian nhất định.
      • Tốn bộ nhớ.
  2. SAX:  Simple API for XML là một phương pháp phân tức XML theo hướng sự kiện, đọc xml từ trên xuống dưới.
    1. Ưu điểm:
      • Tốn ít bộ nhớ.
    2. Nhược điểm:
      • Không support DTD Validate.
      • Không thể truy xuất ngẫu nhiên đối tượng bởi SAX sẽ đọc dữ liệu từ trên xuống dưới.
      • Không thể thêm sữa xóa dữ liệu trong XML.
- Khi nào sử dụng DOM và SAX:
  • Sử dụng SAX cho các tài liệu lớn hoặc cần tiết kiệm bộ nhớ.
  • Khi chỉ cần lấy một nội dụng trong tập hợp các thông tin trong XML sử dụng SAX.
  • Khi cần truy xuất ngẫu nhiên và thao tác với dữ liệu.
  • SAX nhanh hơn DOM.