شرح مكتبه HTMLParser في بايثون - Yehia Online -->
  • الحماية
  • إختبار الأختراق
    • ِعبر الهاتف
    • عبر الويندوز
    • عبر لينكس
    • عبر موقع
  • أكواد جاهزه
    • ِPython
    • Ruby
    • HTML
  • أعلن بلموقع
  • مكتبات
    • Python
    • Ruby
  • حول الموقع
    • أتصل بنا
    • سياسة الخصوصية
    • من نحن
    • إتفاقية الإستخدام

Yehia Online

موقع Yehia يمنح فرصه لتعلم لغات البرمجه و إختبار الأختراق نحاول دائما نشر محتوي مميز وجديد للزائرين وكتابه المعلومه بطريقه سهله مثل تعلم مكتبات بايثون والتعامل مع Python بإحترافيه

شرح مكتبه HTMLParser في بايثون

Yehia 2020-05-13T03:47:14Z Programming-libraries , python-library
يمكن معالجه وتحليل البيانات لأكواد HTML بإستخدام مكتبه في Python تسمي HTMLParser والتي يمكنك من خلالها عمل Output لأكواد HTML وأيضا يمكنك إيجاد Tags في أكواد HTML المضافه. 
مكتبه htmlparser

يتم إضافه بعض الوظائف لتحليل الأكواد:
يتم إستخدام ذلك لإداره التحكم في كلا علامات Tag البدايه والنهايه
handle_startendtag
مثال:
لإداره TAG البدء منفردا يمكن إستخدام
handle_starttag

يمكنك إستخدام تلك الوظائف الأخري:

التحكم في Tag النهايه
handle_endtag
الأحرف التي يتم تمريرها
handle_charref
تعتبر الأهم لإداره البيانات
handle_data
لإداره التعليقات
handle_comment
يمكنك إداراه إرشادات المعالجه وإداره التصريحات بإستخدام
في البدايه تم إستخدام دوال للبدء والغلق والمزيد لاكن يوجد داخل الداله Self , Tag , attr.. إذا كان الأمر صعب ولا تستطيع وضعهم بنفسك في المكان الصحيح يمكنك معرفه ذلك:
handle_charref && handle_entityref
يتم إستخدام بداخلهم:
(self, name):
يتم إستخدام في (self, data): حاله
handle_dat & handle_comment & handle_pi
جميع الدوال الأخري كما هي تستخدم لها فقط.
يمكنك إلقاء نظره علي الأكواد التاليه كمثال لإستخدام المكتبه
يجب عليك تثبيت المكتبه بواسطه Pypi

يمكن إستخراج رابط الصوره و Alt من داخل Tag Img:

لإستخراج البيانات التي تكون داخل علامات Tag وتحليل التعليقات وبدايه Tag ونهايته يمكنك إستخدام الكود التالي:

Start of tag : script
Data     : alert("Hello Yehia");
End of tag : script
Comment  : Write a comment to me
Start of tag : style
Data     : #Yehia{font-size:14px;}
End of tag : style

في أكواد بايثون تجد  تعليق مكتوب line 1,2,3 هذا يعني انه يمكن كتابه أكواد HTML في أسطر متتاليه داخل القوسين(..) لاكن تجد Single Line في سطر أخر وهذا يعني انه يمكنك كتابه أكثر من كود بشكل منفرد داخل قوس () مخصص له
يمكنك إيجاد نوع الصفحه أو decl == Declaration

Decl  : DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd"

إستخراج القيم او Link & Name ATTR

Start tag: h1
Start tag: a
     attr: ('href', 'www.yehia.online')
     attr: ('id', 'yehia')
     attr: ('target', '_blank')


يمكنك تعلم المزيد من مكتبات Python من خلال القائمه www.yehia.online/p/python-library
إنضم لجروب بايثون علي الفيسبوك : فتح الجروب
آو من هنا : فتح الرابط

python-library


No comments:

Post a Comment

Newer Post Older Post Home
Subscribe to: Post Comments (Atom)

ألاكثر شهره

الأقسام

  • adsense
  • blogger
  • code-html
  • code-output
  • polat
  • Programming-libraries
  • python
  • Python-Algorithms
  • python-code
  • Python-Data-Structures
  • python-library
  • ruby
  • security
  • security-android
  • security-linux
  • security-windows
  • spyer
  • spyer-android
  • spyer-linux
  • spyer-website
  • spyer-windows
  • win-program

القوائم

python


نموذج الاتصال

Name

Email

Message




2020 © Yehia Online جميع الحقوق محفوظة لدى

الصفحة الرئيسية Ctrl + Yإعادة نشر المحتويCtrl + q
My-Twitter Ctrl + ?! المساهمة بلنشر Ctrl + ?!