يجب أولا : تثبيت المكتبة من Pypi عبر Pip
مثال : في الكود التالي سيتم طباعة أكواد محتوي الصفحة لموقع Python عبر urllib.request.
تستطيع التحكم في عدد الحروف التي يتم طلبها من الصفحة ويمكن إستخدام read().decode("utf-8") لعمل ترميز.
التحقق من حالة الصفحة تعمل أو لا .
عند طباعة محتوي الصفحة لموقع ما ولم يريد أن يرسل طلب للخادم وحدث خطأ & ذلك لأن الخادم لا يسمح بلدخول أو الوصول التلقائي الآلي لأنة يكون مخصص للمتصفحات ليتمكن من تحليلها.
تستطيع التغلب علي هذا المشكل عبر إرسال User-Agent header وإرسال طلب.
جمع معلومات عن الموقع عبر ()info في بايثون .
يمكنك جمع المعلومات أيضا بإستخدام مكتبة Socket : شرح مكتبة socket في بايثون
- pip install urllib.request
مثال : في الكود التالي سيتم طباعة أكواد محتوي الصفحة لموقع Python عبر urllib.request.
Here Page Content
تستطيع التحكم في عدد الحروف التي يتم طلبها من الصفحة ويمكن إستخدام read().decode("utf-8") لعمل ترميز.
Here Page Content 300 Words
التحقق من حالة الصفحة تعمل أو لا .
200
عند طباعة محتوي الصفحة لموقع ما ولم يريد أن يرسل طلب للخادم وحدث خطأ & ذلك لأن الخادم لا يسمح بلدخول أو الوصول التلقائي الآلي لأنة يكون مخصص للمتصفحات ليتمكن من تحليلها.
تستطيع التغلب علي هذا المشكل عبر إرسال User-Agent header وإرسال طلب.
Here Page Content
جمع معلومات عن الموقع عبر ()info في بايثون .
X-Robots-Tag: all,noodp X-Content-Type-Options: nosniff X-XSS-Protection: 1; mode=block
يمكنك جمع المعلومات أيضا بإستخدام مكتبة Socket : شرح مكتبة socket في بايثون
إنضم لجروب بايثون علي الفيسبوك : فتح الجروب
آو من هنا : فتح الرابط
No comments:
Post a Comment