Back to Question Center
0

آموزش کروم Web Scraper از Semalt Expert

1 answers:

اگر شما از Google Chrome استفاده می کنید، یک افزونه برای مرورگر شما وجود دارد که می تواند صفحات وب را خراشیده کند. این به عنوان "Scrapper" شناخته می شود و می توان آن را بدون مشکل مورد استفاده قرار داد. Scrapper به خراب کردن محتوای وب سایت و آپلود نتایج به اسناد گوگل کمک خواهد کرد.

چگونه یک وب سایت را با استفاده از برنامه Scraper حذف کنید؟

1. Chrome Web Store را در Google Chrome انتخاب کنید؛

2. در برنامه های افزودنی، جستجو برای "Scrapper" انجام شود؛

3. اولین نتیجه جستجو، فرمت شناخته شده به عنوان "Scrapper" است؛

4. دکمه لیست شده به عنوان «اضافه کردن به Chrome» را انتخاب کنید؛

5. بازگشت به فهرست نمایندگان مجلس انگلیس؛

6. بر روی زیر کلیک کنید لینک ؛

7. حالا یک MP را دنبال کنید و مطمئن شوید که ورود مشخص شده است؛

8. برای انتخاب "Scrape مشابه (...) گزینه

9. کنسول برای scrapper در پنجره دیگری ظاهر خواهد شد؛

10. مشاهده محتوای محو شده در scraper کنسول؛

11. برای اطمینان از محتوا به عنوان یک صفحه گسترده گوگل ذخیره می شود، "ذخیره به Google Docs ..." را انتخاب کنید

Scraping extended

قبل از چسبیدن به این دستور غذا لینک

بیایید تصور کنیم ما علاقه مند هستیم به تمام فیلم هایی که با آسیا Argento ستاره دار شده اند، بازیگر مشهور ایتالیایی.

1. آرشیو بسیار دقیق بازیگران در IMDB وجود دارد. سایت آسیا آرژانتینی: https://www.imdb.com/name/nm0000782/؛

2 در اینجا می توانید تمام نقش های بازیگر را مشاهده کنید..بیایید اطلاعاتی را که مورد علاقه ما است، برداشت کنیم

3. سعی کنید آن را همانطور که در بالا توضیح داده شد تکان دهید.

4. شما خواهید دید که لیست کمی تحریف شده است. این به خاطر این واقعیت است که لیست در اینجا می تواند متفاوت باشد؛

5. سر به کنسول اسکرابر. بالا سمت چپ، جعبه کوچکی را می بینید که XPath را می گوید؛

6. Xpath نوعی زبان پرس و جو است که برای XML و HTML کار می کند.

7. XPath می تواند به تعیین بخش هایی از صفحه مورد علاقه شما کمک کند. چیز بعدی این است که یک عنصر مناسب را پیدا کرده و XPath را برای آن بنویسید؛

8. حالا میز ما را ترتیب دهید؛

9. شما خواهید دید که XPath موجود ما، که تمام اطلاعات مورد نیاز است "// div [3] / div [3] / div [2] / div"؛

10. XPath اطلاع سیستم را برای مشاهده متن HTML و عنصر سوم، سپس عنصر دوم و سپس همه آنها را انتخاب کنید.

11. اما ما می خواهیم اطلاعاتمان را از هم جدا کنیم؛

12. استفاده از بخش ستون در کنسول برای scrapper برای انجام این کار؛

13. برای اولین بار عنوان ما را پیدا کنید. استفاده از بازرسی عنصر برای دیدن عنوان؛

14. عنوان را در یک برچسب بررسی کنید. برچسب را به XPath اضافه کنید؛

15. به نظر می رسد که این عبارت به طور مناسب عمل می کند، بنابراین اولین ستون ماست؛

16. در بخش "ستون ها"، نام ستون اول را به عنوان "title" جایگزین کنید.

17. XPath را به آن اضافه کنید؛

18. در بخش ستون، XPath ها نسبی هستند و به این معنی است که "./b" عنصر

19 را انتخاب می کند. در XPath برای ستون عنوان، "./b" را اضافه کنید و "scrape" را انتخاب کنید

20. حالا اجازه دهید یک سال ادامه داشته باشیم. سال ها را می توان در یک دوره یافت؛

21. ایجاد ستون جدید با انتخاب کوچک به علاوه ستون برای عنوان خود؛

22. با استفاده از XPath "./span" یک ستون برای "year" ایجاد کنید؛

23. کلیک کنید شکاف و ببینید که چگونه سال اضافه شد؛

24 Source . انجام شد!

December 6, 2017