يمكن معالجه وتحليل البيانات لأكواد HTML بإستخدام مكتبه في Python تسمي HTMLParser والتي يمكنك من خلالها عمل Output لأكواد HTML وأيضا يمكنك إيجاد Tags في أكواد HTML المضافه.
يتم إضافه بعض الوظائف لتحليل الأكواد:
يتم إستخدام ذلك لإداره التحكم في كلا علامات Tag البدايه والنهايه
handle_startendtag
مثال:
لإداره TAG البدء منفردا يمكن إستخدام
handle_starttag
handle_endtag
الأحرف التي يتم تمريرها
handle_charref
تعتبر الأهم لإداره البيانات
handle_data
لإداره التعليقات
handle_comment
يمكنك إداراه إرشادات المعالجه وإداره التصريحات بإستخدام
في البدايه تم إستخدام دوال للبدء والغلق والمزيد لاكن يوجد داخل الداله Self , Tag , attr.. إذا كان الأمر صعب ولا تستطيع وضعهم بنفسك في المكان الصحيح يمكنك معرفه ذلك:
handle_charref && handle_entityref
يتم إستخدام بداخلهم:
(self, name):
يتم إستخدام في (self, data): حاله
handle_dat & handle_comment & handle_pi
جميع الدوال الأخري كما هي تستخدم لها فقط.
يمكنك إلقاء نظره علي الأكواد التاليه كمثال لإستخدام المكتبه
يجب عليك تثبيت المكتبه بواسطه Pypi
يمكن إستخراج رابط الصوره و Alt من داخل Tag Img:
لإستخراج البيانات التي تكون داخل علامات Tag وتحليل التعليقات وبدايه Tag ونهايته يمكنك إستخدام الكود التالي:
في أكواد بايثون تجد تعليق مكتوب line 1,2,3 هذا يعني انه يمكن كتابه أكواد HTML في أسطر متتاليه داخل القوسين(..) لاكن تجد Single Line في سطر أخر وهذا يعني انه يمكنك كتابه أكثر من كود بشكل منفرد داخل قوس () مخصص له
يمكنك إيجاد نوع الصفحه أو decl == Declaration
إستخراج القيم او Link & Name ATTR
يمكنك تعلم المزيد من مكتبات Python من خلال القائمه www.yehia.online/p/python-library
يتم إضافه بعض الوظائف لتحليل الأكواد:
يتم إستخدام ذلك لإداره التحكم في كلا علامات Tag البدايه والنهايه
مثال:
لإداره TAG البدء منفردا يمكن إستخدام
يمكنك إستخدام تلك الوظائف الأخري:
التحكم في Tag النهايهالأحرف التي يتم تمريرها
تعتبر الأهم لإداره البيانات
لإداره التعليقات
يمكنك إداراه إرشادات المعالجه وإداره التصريحات بإستخدام
في البدايه تم إستخدام دوال للبدء والغلق والمزيد لاكن يوجد داخل الداله Self , Tag , attr.. إذا كان الأمر صعب ولا تستطيع وضعهم بنفسك في المكان الصحيح يمكنك معرفه ذلك:
يتم إستخدام بداخلهم:
يتم إستخدام في (self, data): حاله
جميع الدوال الأخري كما هي تستخدم لها فقط.
يمكنك إلقاء نظره علي الأكواد التاليه كمثال لإستخدام المكتبه
يجب عليك تثبيت المكتبه بواسطه Pypi
يمكن إستخراج رابط الصوره و Alt من داخل Tag Img:
لإستخراج البيانات التي تكون داخل علامات Tag وتحليل التعليقات وبدايه Tag ونهايته يمكنك إستخدام الكود التالي:
Start of tag : script Data : alert("Hello Yehia"); End of tag : script Comment : Write a comment to me Start of tag : style Data : #Yehia{font-size:14px;} End of tag : style
في أكواد بايثون تجد تعليق مكتوب line 1,2,3 هذا يعني انه يمكن كتابه أكواد HTML في أسطر متتاليه داخل القوسين(..) لاكن تجد Single Line في سطر أخر وهذا يعني انه يمكنك كتابه أكثر من كود بشكل منفرد داخل قوس () مخصص له
يمكنك إيجاد نوع الصفحه أو decl == Declaration
Decl : DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd"
إستخراج القيم او Link & Name ATTR
Start tag: h1 Start tag: a attr: ('href', 'www.yehia.online') attr: ('id', 'yehia') attr: ('target', '_blank')
يمكنك تعلم المزيد من مكتبات Python من خلال القائمه www.yehia.online/p/python-library
إنضم لجروب بايثون علي الفيسبوك : فتح الجروب
آو من هنا : فتح الرابط
No comments:
Post a Comment