إنها مشكلة تقليدية. تريد بيانات لاستخدامها في برنامجك ومع ذلك فهي على صفحة ويب. بعض المواقع لديها API، بالطبع، ولكن عادة ما تكون بمفردك. يمكنك الكثير من الصفحة بأكملها من خلال HTTP وكذلك تحليلها. أو يمكنك استخدام بعض الأدوات إلى “كشط” الموقع. طريقة رائعة للقيام بذلك هي Woob – Web خارج المتصفحات.
يستخدم النظام سلسلة من الخلف مصممة خصيصا في مواقع محددة. هناك مجموعة من العقاقير الرسمية، وكذلك يمكنك أن تنتج بنفسك. عندما يكون لديك خزانة مقدمة، يمكنك تكوينها وكذلك استخدامها من Python. إليك مثال على اكتشاف رصيد حساب مصرفي:
>>> من Woob.Core استيراد Woob
>>> من Woob.capabilities.bank استيراد الكابحان
>>> W = Woob ()
>>> w.load_backcends (capbank)
{‘Societegenerale’:
>>> PPRINT (قائمة (W.iter_Accounts ()))
[<معرف الحساب = '7418529638527412' label = u'compte de ch \ xe8ques '>
<حساب معرف = '9876543216549871' Label = u'livret a '>،
<معرف الحساب = '123456789123456789123EUR' Label = U'C / C Eurocompte Confort M Roger Philbert '>]
>>> ACC = التالي (ITER (W.iter_Accounts ()))
>>> acc.balance.
عشري (’87 .32 ‘)
إدراج الإدراك المعروضة مؤثرة، ولكن في النهاية، سترغب في إنتاج وحداتك الخاصة. لحسن الحظ، هناك الكثير من الوثائق حول كيفية القيام بذلك بالضبط. يتيح لك الإطار نشر البيانات إلى الموقع وكذلك فحص النتائج بسرعة. يحتوي كل خزانة على اختبار يمكن أن يجد ما إذا كان التعديل الموجود في الموقع يكسر الرمز، وهو مشكلة نموذجية مع هذه المخططات.
لم نرى الخلفية اختراق. وكذلك سيئة. ومع ذلك، هناك العديد من أمثلة التطبيقات، كل من وحدة التحكم القائمة على وحدة التحكم وكذلك باستخدام QT. على سبيل المثال، يمكنك استعراض الأفلام أو التعامل مع الوصفات أو مواقع المواعدة.
بالطبع، هناك العديد من الطرق الممكن هذه المشكلة. ربما لا تتطلب اكتشافها عندما يغادر القطار التالي.