يمكن معالجه وتحليل البيانات لأكواد HTML بإستخدام مكتبه في Python تسمي HTMLParser والتي يمكنك من خلالها عمل Output لأكواد HTML وأيضا يمكنك إيجاد Tags في أكواد HTML المضافه. 
يتم إضافه بعض الوظائف لتحليل الأكواد:
يتم إستخدام ذلك لإداره التحكم في كلا علامات Tag البدايه والنهايه
handle_startendtag 
مثال:
لإداره TAG البدء منفردا يمكن إستخدام
handle_starttag 
handle_endtag 
الأحرف التي يتم تمريرها
handle_charref 
تعتبر الأهم لإداره البيانات
handle_data 
لإداره التعليقات
handle_comment 
يمكنك إداراه إرشادات المعالجه وإداره التصريحات بإستخدام
في البدايه تم إستخدام دوال للبدء والغلق والمزيد لاكن يوجد داخل الداله Self , Tag , attr.. إذا كان الأمر صعب ولا تستطيع وضعهم بنفسك في المكان الصحيح يمكنك معرفه ذلك:
handle_charref && handle_entityref  
يتم إستخدام بداخلهم:
(self, name): 
يتم إستخدام في (self, data): حاله
handle_dat & handle_comment & handle_pi 
جميع الدوال الأخري كما هي تستخدم لها فقط.
يمكنك إلقاء نظره علي الأكواد التاليه كمثال لإستخدام المكتبه
يجب عليك تثبيت المكتبه بواسطه Pypi
يمكن إستخراج رابط الصوره و Alt من داخل Tag Img:
لإستخراج البيانات التي تكون داخل علامات Tag وتحليل التعليقات وبدايه Tag ونهايته يمكنك إستخدام الكود التالي:
    
    
    
    
    
    
في أكواد بايثون تجد تعليق مكتوب line 1,2,3 هذا يعني انه يمكن كتابه أكواد HTML في أسطر متتاليه داخل القوسين(..) لاكن تجد Single Line في سطر أخر وهذا يعني انه يمكنك كتابه أكثر من كود بشكل منفرد داخل قوس () مخصص له
يمكنك إيجاد نوع الصفحه أو decl == Declaration
    
    
    
    
    
    
إستخراج القيم او Link & Name ATTR
    
    
    
    
    
    
يمكنك تعلم المزيد من مكتبات Python من خلال القائمه www.yehia.online/p/python-library
يتم إضافه بعض الوظائف لتحليل الأكواد:
يتم إستخدام ذلك لإداره التحكم في كلا علامات Tag البدايه والنهايه
مثال:
لإداره TAG البدء منفردا يمكن إستخدام
يمكنك إستخدام تلك الوظائف الأخري:
التحكم في Tag النهايهالأحرف التي يتم تمريرها
تعتبر الأهم لإداره البيانات
لإداره التعليقات
يمكنك إداراه إرشادات المعالجه وإداره التصريحات بإستخدام
في البدايه تم إستخدام دوال للبدء والغلق والمزيد لاكن يوجد داخل الداله Self , Tag , attr.. إذا كان الأمر صعب ولا تستطيع وضعهم بنفسك في المكان الصحيح يمكنك معرفه ذلك:
يتم إستخدام بداخلهم:
يتم إستخدام في (self, data): حاله
جميع الدوال الأخري كما هي تستخدم لها فقط.
يمكنك إلقاء نظره علي الأكواد التاليه كمثال لإستخدام المكتبه
يجب عليك تثبيت المكتبه بواسطه Pypi
يمكن إستخراج رابط الصوره و Alt من داخل Tag Img:
لإستخراج البيانات التي تكون داخل علامات Tag وتحليل التعليقات وبدايه Tag ونهايته يمكنك إستخدام الكود التالي:
Start of tag : script
Data     : alert("Hello Yehia");
End of tag : script
Comment  : Write a comment to me
Start of tag : style
Data     : #Yehia{font-size:14px;}
End of tag : style
في أكواد بايثون تجد تعليق مكتوب line 1,2,3 هذا يعني انه يمكن كتابه أكواد HTML في أسطر متتاليه داخل القوسين(..) لاكن تجد Single Line في سطر أخر وهذا يعني انه يمكنك كتابه أكثر من كود بشكل منفرد داخل قوس () مخصص له
يمكنك إيجاد نوع الصفحه أو decl == Declaration
Decl : DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd"
إستخراج القيم او Link & Name ATTR
Start tag: h1
Start tag: a
     attr: ('href', 'www.yehia.online')
     attr: ('id', 'yehia')
     attr: ('target', '_blank')
يمكنك تعلم المزيد من مكتبات Python من خلال القائمه www.yehia.online/p/python-library
إنضم لجروب بايثون علي الفيسبوك : فتح الجروب
آو من هنا : فتح الرابط

 الصفحة الرئيسية
الصفحة الرئيسية    
 إعادة نشر المحتوي
إعادة نشر المحتوي My-Twitter
My-Twitter    
 المساهمة بلنشر
 المساهمة بلنشر    
No comments:
Post a Comment