Lập trình mạng MIDP trên HTTP client 1.1 Khái quát Đặc tả MIDP 1.0 phát biểu rằng các triển khai của MIDP trên thiết bị di động bắt buộc phải hỗ trợ ít nhất là kết nối HTTP 1.1 sử dụng khung kết nối chung (GCF – Generic Connection Framework). Sử dụng...
1. Lập trình mạng MIDP trên HTTP client
1.1 Khái quát
Đặc tả MIDP 1.0 phát biểu rằng các triển khai của MIDP trên thiết bị di động bắt buộc phải hỗ trợ ít nhất là kết nối HTTP 1.1 sử dụng khung kết nối chung (GCF – Generic Connection Framework). Sử dụng kết nối client HTTP 1.1 nghĩa là thiết bị gởi một yêu cầu (request) và server gởi về một hồi đáp (response) tương ứng.
Hình 1: HTTP client request-response
Bằng cách chỉ dùng kết nối HTTP client nghĩa là server không thể thiết lập liên lạc với thiết bị ngoại trừ bằng cách hồi đáp một request. Một MIDlet HTTP client thông thường sẽ dùng cả hai phương thức HTTP GET và POST.
Đặc tả MIDP 2.0 phát biểu rằng cả HTTP và HTTPS bắt buộc phải được hỗ trợ.
1.2 Thân của thông điệp HTTP
Thông tin gởi trong thân thông điệp HTTP request và response đơn giản là một luồng byte. MIDlet và servlet chọn kiểu định dạng thông tin để mã hóa các byte này.
1.3 Thân của thông điệp SOAP/HTTP
Các điểm cuối dịch vụ Web dựa trên SOAP trao đổi các thông điệp SOAP với nhau. HTTP là một cơ chế mặc định dùng để truyền thông điệp SOAP. Thông điệp SOAP chứa dữ liệu theo định dạng XML. Thông điệp XML có thể dùng cả UTF-8 hay UTF-16 để làm bảng mã và mã hóa.
1.4 Khái quát về dịch vụ Web (Web service), SOAP và WSDL
Thuật ngữ “Dịch vụ Web” (Web service) nói đến truyền thông ứng dụng-đến-ứng dụng (application-to-application). Một dịch vụ Web đơn giản là một dịch vụ trên Internet có khả năng được truy xuất thông qua giao diện theo khuôn dạng sử dụng các giao thức Internet chuẩn như HTTP.
World Wide Web Consortium (W3C) định nghĩa dịch vụ Web như sau:
Một dịch vụ Web là một hệ thống phần mềm được nhận dạng bằng một URI (Uniform Resource Identifier), mà các giao diện chung và sự gắn kết của nó được định nghĩa và mô tả bằng XML. Định nghĩa của nó có thể được nhận ra bằng các hệ thống phần mềm khác. Các hệ thống này sau đó có thể tương tác với dịch vụ Web theo phương cách được mô tả trong định nghĩa của nó, sử dụng các thông điệp theo XML được chuyển bằng các giao thức Internet.
Hai đặc tả quan trọng về dịch vụ Web là Ngôn ngữ mô tả dịch vụ Web (Web Services Description Language – WSDL) và Giao thức truy xuất đối tượng đơn giản (Simple Object Access Protocol – SOAP). WSDL được dùng để mô tả một dịch vụ Web đã được triển khai. SOAP được dùng để định nghĩa định dạng của thông điệp được trao đổi giữa các điểm cuối (thí dụ như client và server) của dịch vụ Web trong suốt quá trình hoạt động của dịch vụ Web đó. Một dịch vụ Web có thể tự đăng ký ở một nơi đăng ký thích hợp (ví dụ bằng cách cung cấp mô tả WSDL của nó) để client có thể nhận ra nó. Các tiến trình này được gọi là quá trình đăng ký và nhận biết dịch vụ.
1.5 Java, Web service và SOAP
Lĩnh vực dịch vụ Web đang phát triển nhanh chóng. Tại thời điểm này Ủy ban công nghệ Java (Java Techonology Community) đã xây dựng phiên bản đầu tiên của Java API cho RPC dựa trên XML (Java API for XML-based RPC – JAXRPC) cho J2SE. Một gói tùy chọn cho dịch vụ Web trên J2ME cũng đang được xây dựng.
Đặc tả MIDP 1.0 và MIDP 2.0 không xác định bất kỳ hỗ trợ nào cho XML hay SOAP. Các nhà phát triển MIDP muốn sử dụng XML hay SOAP thường phải sử dụng các thư viện bên ngoài. Điều này rất bất lợi vì mỗi MIDlet phải chứa các thư viện này. Các thư viện như vậy thường khoảng 25 đến 50 KB (kích thước file .class). Điều này có khả năng sẽ làm giảm không gian cho ứng dụng MIDlet.
Luận án này được phát triển bằng các thư viện mở KXML và KSOAP. Một vài thư viện XML và SOAP khác nhắm đến thiết bị J2ME cũng có thể dễ dàng được tìm thấy, và có thể được sử dụng theo phương cách tương tự.
2. Tối ưu hóa truyền thông Client/Server cho các ứng dụng di động
2.1 Ứng dụng di động client/server
Ngoài các ứng dụng chạy đơn trên thiết bị di động không cần tương tác với tài nguyên bên ngoài, còn có nhu cầu một môi trường phân tán với client có nhu cầu liên lạc với server sử dụng kết nối IP. Ta sẽ xét một số vấn đề điển hình về liên lạc client/server có thể phát sinh trong quá trình kết nối giữa Java 2 Platform, Enterprise Edition (J2EE), nền tảng server và MIDlet. Tiếp theo sẽ so sánh các giao thức khác nhau, có thể được dùng để phát triển các loại ứng dụng phân tán này.
Ngoài ra, lập trình viên có thể sử dụng thêm các tầng trừu tượng giữa giao thức chuyển vận, dựa trên HTTP, và chính ứng dụng để xây dựng một kiến trúc linh động có thể được tối ưu hóa. Với cách tiếp cận này, giao thức chuyển vận được chọn có thể được chuyển đổi tương đối dễ dàng mà không cần phải hiệu chỉnh logic của ứng dụng.
Ở đây ta sẽ dùng một proxy servlet để có thể nâng cao hiệu quả của các ứng dụng di động client/server.
Trên thực tế, vô số ứng dụng Mobile Information Device Profile (MIDP) không chỉ chạy trên các thiết bị di động, mà cũng có truy xuất đến server, và do đó thể hiện một ứng dụng phân tán. Nhiều ứng dụng di động chỉ thật sự hoạt động khi kết nối đến server. Kết nối có thể “luôn luôn mở (always on)” hay chỉ mở khi ứng dụng cần liên lạc với server. Sử dụng cách tiếp cận phân tán, ứng dụng di động có thể truy xuất đến các cơ sở dữ liệu ngoại, vì những công việc quá phức tạp đối với khả năng hạn chế của thiết bị MIDP có thể được chuyển đến cho một server mạnh hơn. Do đó, lời giải cho ứng dụng di động doanh nghiệp chỉ có thể thực hiện thông qua tương tác giữa J2EE và Java 2 Platform, Micro Edition (J2ME). Tuy nhiên, trong quá trình trao đổi dữ liệu giữa server và client di động, cần phải quan tâm đến các vấn đề liên quan, đặc biệt là các vấn đề liên quan đến hiệu suất truyền tải và xử lý dữ liệu trên thiết bị.
Đối với giải pháp doanh nghiệp dựa trên công nghệ J2ME, cần phải quan tâm đến sự hạn chế của cả kết nối mạng và tài nguyên của thiết bị, không giống như môi trường thông thường của máy tính cá nhân với kết nối mạng cố định. Điều này có nghĩa là nhà phát triển nên lường trước được các khoảng thời gian trễ dài trên băng thông hạn chế. Hơn nữa, bất kỳ trong tình huống nào cũng không nên cho rằng thiết bị di động luôn luôn có kết nối. Về tài nguyên, ta phải đối mặt với vấn đề khả năng tính toán hạn chế cùng với khả năng lưu trữ tương đối của thiết bị. Do đó, trước khi phát triển một ứng dụng phân tán cho client di động, ta cần phải xem xét kỹ các yếu tố trước khi chọn giao thức, bởi vì quyết định này có thể có ảnh hưởng lớn đến hiệu suất của ứng dụng.
HTTP là một giao thức liên lạc client/server lý tưởng cho ứng dụng Java di động. Đối với mỗi đặc tả, thiết bị tương thích MIDP 1.0 phải hỗ trợ HTTP. Các giao thức khác như TCP hay UDP là tùy chọn. Bởi vì không phải tất cả thiết bị MIDP đều hỗ trợ truyền thông socket hay datagram, do đó triển khai HTTP trên thiết bị di động cho phép tối ưu khả năng chuyển đổi giữa các thiết bị từ các nhà sản xuất khác nhau. Mặc dù một số thiết bị, như Nokia 6800 hỗ trợ kết nối socket, nhưng để tương thích tối đa, nên sử dụng HTTP làm giao thức trao đổi giữa client và server.
Một lợi điểm khác nữa là giao thức HTTP được hưởng truy xuất không lỗi (trouble-free access) thông qua tường lửa. Bởi vì server và client di động hầu như được tách biệt bằng firewall, HTTP không cần phải cấu hình thêm. Mặc dù vậy, ta cũng nên qua tâm đến các rủi ro bảo mật có thể có khi mở kết nối HTTP ra thế giới bên ngoài. Java cung cấp API lập trình mạng, hỗ trợ giao thức HTTP 1.1. Ta dễ dàng tạo ra các request GET, POST, và HEAD trong ứng dụng Java.
2.2 Các loại giao thức khác nhau
Bây giờ ta đã chọn HTTP làm giao thức chuyển vận, vai trò của người phát triển là phải quyết định định dạng thông điệp để trao đổi dữ liệu giữa server và client. Nền tảng J2ME không đưa ra các cơ chế đã được chuẩn hóa như Java Remote Method Invocation (RMI) và Java API for XML-based Remote Procedure Call (JAX-RPC) (vốn rất tốn tài nguyên), người phát triển phải tự mình định nghĩa định dạng và lớp truyền thông trên lớp chuyển vận HTTP. Có nhiều sự lựa chọn, ta sẽ xem xét chi tiết dưới đây.
Chủ yếu có hai cách định nghĩa định dạng thông điệp: Một là định dạng thuần nhị phân, được tối ưu hóa để bảo đảm hiệu suất cao nhất. Hai là định dạng phức tạp dựa trên XML, ví dụ như SOAP, cung cấp khả năng đọc và khả chuyển cao, nhưng hiệu suất rất kém, đặc biệt là với các thiết bị di động với băng thông và tốc độ xử lý hạn chế. Người phát triển phải đối mặt với thử thách là phải lựa chọn giải pháp tốt nhất cho ứng dụng. Về cơ bản, kích thước của giao thức tăng tương ứng với khả năng tự mô tả, do đó làm giảm hiệu quả truyền thông trên mạng điện thoại di động băng thông hẹp. Tăng khả năng human-readability, thì đồng thời cũng gia tăng các định dạng dựa trên XML, cũng như hiệu suất tính toán để phát sinh và phân tích các thông điệp đến.
Hình 2: Biểu đồ so sánh các giao thức liên lạc khác nhau
2.3 Định dạng nhị phân độc quyền (Proprietary Binary Format)
Định dạng này có khả năng linh động cao và có thể được phát sinh một cách dễ dàng. Nó có thể được gởi bằng HTTP GET hay HTTP Post request đến một server J2EE, ví dụ như Tomcat của Apache Software Foundation.
Sự khác biệt chính giữa GET và POST request là với HTTP GET, tất cả các tham số hay dữ liệu được chuyển đến server được chứa trong chính địa chỉ URL. Điều này có nghĩa là ta có thể gọi trực tiếp các thủ tục của server từ xa thông qua URL và các tham số của nó. Tuy nhiên, để chuyển các tham số, ta bị giới hạn bằng định dạng văn bản đơn giản với độ dài các tham số bị giới hạn bởi kích thước lớn nhất của chiều dài dòng request của máy chủ Web. Ví dụ, trên server Web Tomcat, kích thước tối đa mặc định của dòng request được đặt là 8190 bytes và có thể được thay đổi.
HTTP POST thích hợp hơn đối với việc truyền lượng dữ liệu lớn hay thậm chí dữ liệu nhị phân từ thiết bị di động đến server, bởi vì dữ liệu được gởi đến server độc lập với URL. Việc này có ưu điểm là lượng dữ liệu không bị hạn chế, như trong trường hợp của phương thức GET. Trên Java, việc này có thể thực hiện bằng cách mở một luồng (stream) tách biệt, trên đó có các phương thức cần thiết của Java cho stream. Do đó ta có thể truyền dữ liệu nhị phân đến server mà không gặp vấn đề gì. Dữ liệu trao đổi giữa client và server có thể được tổ chức hoàn toàn bằng các luồng.
Ưu điểm chính của việc liên lạc dùng định dạng dữ liệu nhị phân trên HTTP là hiệu suất truyền cao và kích thước phần tải (payload) cô đọng. Mặt khác, khuyết điểm của nó là nó không có tính tự mô tả (self-descriptive), và điều kiện tiên quyết là phải biết trước định dạng, ở cả hai phía client và server, trước khi có thể bắt đầu phát triển ứng dụng. Điều này dẫn đến vấn đề là bất kỳ thay đổi nào đến định dạng thông điệp phải được nhất quán giữa client và server. Ngoài ra, với sự gia tăng số lượng các thông điệp không tương tự nhau mà server cần phải xử lý, mã chương trình trở nên phức tạp.
2.4 Sự tuần tự hóa đối tượng
Một cách tiếp cận hay để khắc phục các khó khăn này là sử dụng các đối tượng được tuần tự hóa. Ngoài các kiểu dữ liệu chuẩn được hỗ trợ bởi các phương thức đọc và ghi trong các lớp luồng, ta có khả năng thực hiện tuần tự hóa các đối tượng bất kỳ để việc truyền dữ liệu giữa client và server được dễ dàng. Vấn đề là MIDP 1.0 không giống như môi trường hoàn chỉnh J2SE, mặc định MIDP không hỗ trợ tuần tự hóa (serialization) và phản ánh (reflection) đối tượng. Do thiếu một cơ chế tổng quát, mỗi lớp phải đưa ra sự thực hiện tính năng này theo cách của riêng mình.
Tuần tự hóa có được thông qua một giao diện phù hợp đòi hỏi đối phải cung cấp các phương thức cần thiết cho việc tuần tự và giải tuần tự nó. Cần chú ý là các lớp với cơ chế tuần tự độc quyền của nó phải hiện diện với các phiên bản giống nhau ở cả hai phía client và server.
2.5 Trao đổi thông điệp bằng XML
XML thể hiện định dạng thông điệp tự mô tả. XML không yêu cầu bắt buộc phải triển khai một giao thức RPC giống như SOAP dựa trên XML. Nhà phát triển có thể chỉ xây dựng định dạng thông điệp phù hợp dựa theo cơ sở của XML để thực hiện việc trao đổi dữ liệu giữa client và server. Ưu điểm có tính quyết định của XML là nó đã được chuẩn hóa và do đó có tính khả chuyển cao. Hơn nữa, nó dựa vào văn bản, dữ liệu có cấu trúc có thể được mô tả theo phương cách có tính tự giải thích (self-explanatory). Trong lĩnh vực doanh nghiệp, XML đã chiếm được ưu thế so với các giao thức thông điệp khác chủ yếu là do sự hỗ trợ tốt của nền tảng J2EE.
Ngoài việc truyền lượng dữ liệu lớn hơn khi dùng XML cũng như tăng thêm phần dư thừa của XML, ta còn gặp vấn đề khác với các thiết bị di động. Trong khi nền tảng J2EE hỗ trợ XML, thì môi trường MIDP 1.0 không cung cấp hỗ trợ tích hợp nào cho việc phân tích XML. Các giải pháp dựa trên XML cần phải bao gồm bộ phân tích XML trên MIDP client. Mặc dù có nhiều bộ phân tích mã nguồn mở, chẳng hạn như NanoXML, TinyXML, hay kXML, có thể được dùng cho mục đích này và đã được thiết kế để sử dụng tối thiểu tài nguyên, tuy nhiên dù sao thì vẫn yêu cầu không gian lưu trữ trên thiết bị, vốn thường rất ít để chia sẻ.
Ở đây ta sử dụng KXML của Enhydra, bởi vì nó chỉ chiếm 21 KB bộ nhớ.
Để phân tích tài liệu XML, cần phải có thêm bộ nhớ và khả năng tính toán tương ứng. Trong hầu hết trường hợp, thông điệp XML lớn hơn nhiều so với thông điệp nhị phân – chủ yếu là do tính dài dòng của định dạng XML.
2.6 Nén nhị phân XML
Định dạng WBXML giúp giảm kích thước tài liệu XML một cách đáng kể, trong đó định dạng văn bản của tài liệu XML được chuyển sang một dạng nhị phân. Định dạng này cũng được dùng để chuyển các trang WML, kích thước được giảm xuống rất nhiều bằng cách thay các thẻ, thuộc tính, và các giá trị thông dụng bằng một tập các thẻ bài (token) có thể cấu hình được. Cũng hoàn toàn giống như việc mã hóa và giải mã các thông điệp trong thiết bị WAP được thực hiện thông qua một WAP gateway, việc liên lạc giữa thiết bị MIDP và server J2EE cũng có thể tương tự. Bộ phân tích đảm nhận việc mã hóa và giải mã thông điệp một cách phù hợp, bộ phân tích phải hỗ trợ WBXML. Ví dụ, bộ phân tích KXML của Endydra hỗ trợ giao thức này và cho phép truyền dữ liệu một cách hiệu quả giữa client và server. Server đương nhiên cũng cần phải hiểu định dạng WBXML. Một cách thay thế là, việc liên lạc phải được xử lý thông qua một proxy hay một WBXML gateway.
2.7 XML-RPC
XML-RPC là một giao thức truyền thông điệp cực nhẹ cho phép thực thi các thủ tục từ xa trên mạng thông qua HTTP. Client gởi một thông điệp XML thông qua HTTP POST đến server để phân tích. Một thủ tục nội của server trả về kết quả là response, cũng ở dạng một thông điệp XML, trả về cho client.
Do đó XML-RPC có được các ưu điểm của XML. Nó xây dựng rất ít tính năng, cho phép xác định và truyền các kiểu dữ liệu giống như các tham số để triệu gọi các thủ tục từ xa theo cách tiếp cận trung lập nền (platform-neutral). Phạm vi của định dạng chủ ý càng nhỏ càng tốt bằng cách giới hạn sáu loại kiểu dữ liệu gốc (primitive): int, boolean, string, double, datetime và base64 và hai kiểu liên hợp (complex): struct và array. Điều này làm cho giao thức đặc biệt thích hợp với các ứng dụng J2ME và kết nối mạng điện thoại di động băng thông hẹp.
Nhược điểm ở đây, cũng giống như với XML, là nền tảng J2ME không cung cấp bất kỳ hỗ trợ tích hợp nào cho XML-RPC, và nó cần phải dựa vào các gói bổ sung như KXM-RPC của Enhydra để triển khai ứng dụng trên thiết bị. Gói KXML-RPC được xây dựng trên nền của KXML và chạy khá tốt với chỉ 24KB tài nguyên thiết bị bao gồm KXML. Các mã nguồn liên quan của XML-RPC cũng cung cấp cho việc cài đặt điểm liên lạc tương ứng tại server. Một ví dụ của nó là Apache XML-RPC dựa trên nền tảng Java của Tổ chức phần mềm Apache (Apache Software Foundation), có thể được áp dụng với Tomcat Servlet engine.
2.8 SOAP
Simple Object Access Protocol (SOAP). Đầu tiên Microsoft phát triển giao thức này cùng với Useland để đáp ứng nhu cầu của các nhà phát triển muốn phát triển các ứng dụng phân tán với các công nghệ của Microsoft. SOAP và các phiên bản trước của XML-RPC có cùng nguồn gốc. Tuy nhiên, không giống như SOAP, XML-RPC đã được cải tiến và không gia tăng tính phức tạp. Việc định nghĩa phức tạp giúp cho các giao thức mở rất linh động, điều này giải thích vì sao nó là chuẩn trong thực tế cho việc gọi hàm từ xa bằng XML trên HTTP.
Đáng tiếc là, với các nhược điểm vốn có của lĩnh vực di động, nó dẫn tới nhiều dữ liệu thừa mà không luôn luôn cần đến, nhưng chiếm nhiều tài nguyên. Đặc tả giao thức hiện tại là 1.2 và ngoài tập tính năng của XML-RPC, nó cung cấp các tính năng thêm như tính quan tâm không gian tên (namespace awareness), cơ chế định kiểu dữ liệu, và việc truyền dữ liệu header bổ sung. SOAP cũng có cùng mặt hạn chế, J2ME không cung cấp bất kỳ hỗ trợ nào cho nó. Các client cần hỗ trợ SOAP cần phải tích hợp trong các chức năng của ứng dụng. Trên đầu cuối client, một giải pháp là dùng Enhydra ME project-kSOAP. Tuy nhiên, gói kSOAP yêu cầu ít nhất 41 KB bộ nhớ, là một gánh nặng cho ứng dụng trên thiết bị.
Trong trường hợp này, ta phải bảo đảm bộ nhớ và băng thông yêu cầu có thể thỏa mãn. Đương nhiên server cũng cần phải hỗ trợ SOAP. Phía server thì có nhiều giải pháp, có thể dùng dự án mã nguồn mở Apache SOAP (cũ) hoặc dự án Axis mới hơn, Axis nên dùng cho các dự án mới. Axis cũng thuộc Apache.
2.9 Tối ưu hóa bằng Proxy
Ta đã khảo sát nhiều tùy chọn khác nhau cho việc trao đổi dữ liệu client/server thông qua HTTP. Tùy thuộc vào mục đích của ứng dụng, ta có thể quyết định sử dụng giữa giao thức nén theo ý mình với các giao thức linh động nhưng dài dòng đã trở thành chuẩn được sử dụng rộng rãi. Nếu ta muốn kết hợp các ưu điểm của các phương pháp đối lập này, thì có một giải pháp khá thú vị – sử dụng một proxy server hoặc một gateway giữa MIDP client và server J2EE. Như ta đã đề cập ở trên, thông điệp XML có thể được nén thông qua WBXML gateway.
Tương tự như vậy, ta cũng có thể thực hiện một proxy cho giao thức độc quyền, chuyển nó thành giao thức chuẩn như XML-RPC hay SOAP. Nhờ vậy, dữ liệu được chuyển từ MIDP client đến proxy bằng một giao thức nhẹ chẳng hạn như một giao thức nhị phân hay WBXML, để tối thiểu hóa kích thước thông điệp và tận dụng tốt hơn băng thông hạn chế. Proxy, đến lượt nó, đóng vai trò như một client đến server J2EE và dịch request của giao thức nhẹ đó thành giao thức dựa trên XML của server và ngược lại.
Dùng proxy, ta có khả năng kết nối ứng dụng đến một server đang tồn tại với sự giúp đỡ của giao thức được tối ưu hóa, ví dụ server đó có thể đang hỗ trợ SOAP hay XML-RPC. Điều này có ưu điểm là khả năng liên kết và hiệu suất đều được nâng cao. Mặt khác, cần phải xem xét một vấn đề là sự gia tăng độ phức tạp của toàn bộ hệ thống sẽ gây khó khăn cho quá trình phát triển ứng dụng.
Hình 3: Mô hình mẫu dùng Proxy
Theo javavietnam.org