আগের দিনগুলিতে, ওয়েব পেজ ডাউনলোড করা অতি সাধারণ ছিল—HTTP সহজ ছিল, ওয়েবসাইটগুলি বেশিরভাগ স্ট্যাটিক HTML ছিল। আজকের ওয়েব জটিল—HTTPS, JavaScript-নির্ভর বিষয়বস্তু, এবং AJAX প্লাবন ভেবে দেখুন। স্ট্যাটিক বিষয়বস্তুর জন্য, java.net.URL এবং java.net.HttpURLConnection সরাসরি পছন্দ—না ঝঙ্কার, শুধু কাজ করে। কিন্তু যদি আপনি JavaScript দ্বারা লোড করা ডাইনামিক বিষয়বস্তুর সাইটগুলিকে লক্ষ্য করেন, অন্য টুল্স যেমন Selenium বা HtmlUnit ব্যবহার করা দরকার হবে। ভুলবেন না, ডাউনলোড করা পৃষ্ঠাটির সাথে আপনি কি করতে চান সেটির উপর সঠিক টুল নির্বাচন করা নির্ভর করে। HTML পার্স করা?
java.net.URL
java.net.HttpURLConnection
আসুন জাভার সাথে রিয়েল-ওয়ার্ল্ড HTML নিয়ে কাজ করার জন্য একটি সুবিধাজনক লাইব্রেরি, Jsoup ব্যবহার করি। প্রথমে, নির্ভরতাটি যোগ করুন.
চলুন Java 11-এর HttpClient, HttpRequest, এবং HttpResponse ব্যবহার করে GET অনুরোধ পাঠাই এবং কিছু ডেটা সংগ্রহ করা যাক.
HttpClient
HttpRequest
HttpResponse
জাভাতে HttpURLConnection ক্লাস ব্যবহার করে বেসিক অথেনটিকেশন সহ HTTP অনুরোধ পাঠানো খুবই সহজ। এখানে একটি দ্রুত উদাহরণ দেওয়া হল.
HttpURLConnection