Οδηγός Semalt για επέκταση Scraper για Chrome

Για να επιβιώσει και να αναπτυχθεί τελικά κάθε επιχείρηση, είναι απαραίτητο να μείνετε μπροστά από τους ανταγωνιστές και τους διάφορους κινδύνους. Η λήψη αποφάσεων βάσει αναλυτικών δεδομένων είναι ένας σίγουρος τρόπος για να ξεχάσετε αυτά τα προβλήματα. Τέτοια δεδομένα μπορούν να ληφθούν μέσω διάλυσης δεδομένων. Εκεί έρχεται η εύκολη επέκταση ξύστρου για το Chrome: όχι μόνο θα διευκολύνει τη διαδικασία συλλογής δεδομένων, αλλά και θα καθιστά δυνατή τη σάρωση εν κινήσει χωρίς περίπλοκες ρυθμίσεις.

Πώς να χρησιμοποιήσετε το Scraper

    1. Το πρώτο πράγμα που πρέπει να κάνετε είναι να εγκαταστήσετε την επέκταση, οπότε κατευθυνθείτε προς το Chrome web store, αναζητήστε το "scraper" και κάντε κλικ στην προσθήκη στο Chrome.

    2. Πλοηγηθείτε στον ιστότοπο από τον οποίο σκοπεύετε να διαγράψετε δεδομένα , σημειώστε την καταχώριση που σας ενδιαφέρει επισημαίνοντάς την. Κάντε δεξί κλικ πάνω του και επιλέξτε "ξύστε παρόμοιο" στο μενού που εμφανίζεται.

    3. Με αυτόν τον τρόπο θα ξεκινήσει ένα ξεχωριστό παράθυρο κονσόλας ξύστρας. Εδώ, θα δείτε μια λίστα με τα αποκομμένα δεδομένα .

    4. Για να αποθηκεύσετε το περιεχόμενο, κάντε κλικ στο "αποθήκευση σε έγγραφα Google", αυτό θα εξαγάγει αυτόματα τα δεδομένα σε ένα υπολογιστικό φύλλο Google.

Εκτεταμένη απόξεση

Σε περίπτωση που σκοπεύετε να αποκόψετε περισσότερα δεδομένα, μπορείτε να χρησιμοποιήσετε την προηγμένη προσέγγιση. Σημειώστε ότι θα είναι πολύ πιο εύκολο να εργαστείτε με το εργαλείο εάν έχετε κάποια γνώση HTML. Ας υποθέσουμε ότι θέλετε να αποκόψετε δεδομένα από μια πηγή που έχει ένα αρχείο βασισμένο σε δεδομένα χρονοσειρών. Σε αυτήν την περίπτωση, εάν δοκιμάσετε τη μέθοδο που περιγράφεται παραπάνω, θα λάβετε τα αλλοιωμένα δεδομένα.

Για να επιλύσετε αυτό το ζήτημα, μπορείτε να χρησιμοποιήσετε μια γλώσσα ερωτήματος HTML και XML γνωστή ως XPath. Τι κάνει? Το XPath αναγνωρίζει δεδομένα σχετικά με τα διαφορετικά στοιχεία που περιέχονται σε κάθε επιλογή. Το παρακάτω είναι ένας οδηγός για το πώς να το κάνετε:

1. Μεταβείτε στην κονσόλα Scraper, επάνω αριστερά θα παρατηρήσετε ένα κουμπί "XPath", κάντε κλικ σε αυτό και προχωρήστε στη συναρμολόγηση του αρχικού πίνακα.

2. Πρέπει να γράψετε το XPath για το σωστό στοιχείο. Το τρέχον XPath που περιλαμβάνει όλες τις πληροφορίες θα εμφανίζεται σε μορφή όπως αυτή "// div [3] / div [3] / div [2] / div". Τα στοιχεία <div> θα αναγνωρίζονται στο έγγραφο HTML από τον υπολογιστή.

3. Για να διαχωρίσετε τα αναγνωρισμένα δεδομένα, πρέπει να χρησιμοποιήσετε τις στήλες Scraper. Για να το κάνετε αυτό, πρέπει να αναζητήσετε τους διαφορετικούς τύπους πληροφοριών που έχετε στη διάθεσή σας. Ανάλογα με τα δεδομένα που διαγράφετε, ενδέχεται να έχετε τίτλους. Αυτοί οι τίτλοι υπάρχουν δίπλα σε κάθε σύνολο δεδομένων. Συνοδεύονται από μια ετικέτα, σε αυτήν την περίπτωση, μια <b> ετικέτα.

4. Χρησιμοποιώντας το στοιχείο επιθεώρησης εντοπίστε και προσθέστε την ετικέτα <b> στο XPath σας. Τώρα μπορείτε να επισημάνετε αυτήν την πρώτη στήλη ως "στήλη τίτλου" καθώς θα εμφανίζει τους τίτλους. Προχωρήστε στη δημιουργία διαφορετικών XPath για κάθε στήλη που χρειάζεστε.

5. Κάντε κλικ στο scrape και η επέκταση θα συλλέξει αυτόματα τα δεδομένα και θα τα οργανώσει στις διάφορες στήλες που έχετε ορίσει.