ওয়েব থেকে ডেটা কপি করার জন্য এক্সেল এর ব্যবহার
ওয়েব স্ক্র্যাপিং একটি স্বয়ংক্রিয় পদ্ধতি ব্যবহার করে একটি ওয়েবসাইট থেকে তথ্য, তথ্য, বা ইমেজ নিষ্কাশন করার কাজ। সম্পূর্ণ স্বয়ংক্রিয় অনুলিপি এবং পেস্ট হিসাবে এটি চিন্তা করুন।
আমরা যে ওয়েবসাইটগুলিতে যা চাই তা যেতে আমরা একটি অ্যাপ্লিকেশন লিখি বা ব্যবহার করি এবং সেই ওয়েবসাইটগুলির কাছ থেকে আমরা নির্দিষ্ট নির্দিষ্ট জিনিসের একটি অনুলিপি তৈরি করি। এটি একটি সম্পূর্ণ ওয়েবসাইট ডাউনলোড চেয়ে অনেক বেশি সুনির্দিষ্ট।
যে কোনও টুলের মতো, ওয়েব স্ক্র্যাপিং ভাল বা মন্দ জন্য ব্যবহার করা যেতে পারে। ওয়েবসাইটগুলি স্ক্র্যাপ করার আরও ভাল কারণগুলি এটির সামগ্রী, মূল্য তুলনা কেনাকাটা, বা স্টক মার্কেট তথ্য পর্যবেক্ষণের উপর ভিত্তি করে একটি সার্চ ইঞ্জিনে এটি র্যাংকিং করবে। আপনি এমনকি এটি একটি গবেষণা সরঞ্জাম হিসাবে ব্যবহার করতে পারে।
কিভাবে এক্সেল সঙ্গে ওয়েবসাইট স্ক্র্যাপ করতে পারেনঃ
এটি বিশ্বাস করুন নাকি এক্সেল 2003-এ এক্সেল 2003 থেকে দীর্ঘ সময় ধরে ওয়েবসাইট থেকে তথ্য বের করার ক্ষমতা ছিল। এটি কেবলমাত্র ওয়েব স্ক্র্যাপিং এমন কিছু যা অধিকাংশ লোক মনে করেন না, স্প্রেডশীট প্রোগ্রামটি ব্যবহার করার বিষয়ে একা চিন্তা করুন কাজটি কর. কিন্তু এটা বিস্ময়কর, সহজ এবং শক্তিশালী। আসুন মাইক্রোসফ্ট অফিস কীবোর্ড শর্টকাট সংগ্রহ করে কীভাবে এটি করা যায় তা শিখুন।
আপনি স্ক্র্যাপ করতে চান সাইট খুঁজুনঃ
আমরা যা করতে যাচ্ছি তা হল প্রথম ওয়েব পৃষ্ঠাগুলি যা আমরা তথ্য পেতে চাই। এই লিংকে যান এবং অনুসন্ধান করুন। আমরা অনুসন্ধান শব্দ "ঘন ঘন ব্যবহৃত শর্টকাট" ব্যবহার করতে যাচ্ছি। আমরা নির্দিষ্ট অ্যাপের নাম ব্যবহার করে এটি আরও নির্দিষ্ট করতে পারি, যেমন আউটলুক, এক্সেল, ওয়ার্ড ইত্যাদি। ফলাফল পৃষ্ঠাটি বুকমার্ক করা একটি ভাল ধারণা হতে পারে যাতে আমরা সহজেই সেখানে ফিরে যেতে পারি।
অনুসন্ধান ফলাফলে ক্লিক করুন, "উইন্ডোজের জন্য এক্সেলের কীবোর্ড শর্টকাট"। একবার যে পৃষ্ঠায়, এক্সেল সংস্করণের তালিকা খুঁজে বের করুন এবং নতুন সংস্করণে ক্লিক করুন। এখন আমরা সর্বশেষ এবং সর্বশ্রেষ্ঠ সঙ্গে কাজ করছি।
আমরা আমাদের অনুসন্ধান ফলাফল পৃষ্ঠাতে ফিরে যেতে পারি এবং অন্যান্য সমস্ত অ্যাপ্লিকেশানগুলির জন্য তাদের ট্যাবগুলিতে ফলাফলগুলি খুলতে এবং তাদের বুকমার্ক করতে পারি। এটা এমনকি এই ব্যায়াম জন্য, একটি ভাল ধারণা। এখানেই বেশিরভাগ লোকেরা অফিস শর্টকাট সংগ্রহ করতে থামবে, কিন্তু আমাদের নয়। আমরা তাদের এক্সেলে রাখতে যাচ্ছি যাতে আমরা যখনই চাই, আমরা তাদের সাথে যা করতে পারি তা করতে পারি।
ওপেন এক্সেল এবং স্ক্র্যাপঃ
এক্সেল খুলুন এবং একটি নতুন ওয়ার্কবুক শুরু করুন। অফিস শর্টকাট হিসাবে কাজ বই সংরক্ষণ করুন। আপনার যদি OneDrive থাকে তবে এটি সংরক্ষণ করুন যাতে অটোস্যাভ বৈশিষ্ট্যটি কাজ করবে।
একবার ওয়ার্কবুক সংরক্ষিত হলে ডেটা ট্যাবে ক্লিক করুন।
ডেটা ট্যাবের রিবনটিতে, ওয়েব থেকে ক্লিক করুন।
থেকে ওয়েব উইজার্ড উইন্ডো খুলবে। এই যেখানে আমরা ওয়েবসাইটের ওয়েব ঠিকানা বা ইউআরএল রাখি যার থেকে আমরা ডেটা স্ক্র্যাপ করতে চাই। আপনার ওয়েব ব্রাউজারে স্যুইচ করুন এবং URL টি অনুলিপি করুন।
ওয়েব ওয়েব উইজার্ডের URL ক্ষেত্রটিতে URL টি আটকে দিন। আমরা বেসিক বা উন্নত মোডে এটি ব্যবহার করতে পারেন। উন্নত মোডটি ওয়েবসাইট থেকে ডেটা অ্যাক্সেস করার জন্য আমাদের আরো অনেক বিকল্প দেয়। এই ব্যায়ামের জন্য, আমাদের কেবল মৌলিক মোড প্রয়োজন। ওকে ক্লিক করুন।
এক্সেল এখন ওয়েবসাইট সংযোগ করার চেষ্টা করবে। এই কয়েক সেকেন্ড সময় লাগতে পারে। আমরা যদি একটি অগ্রগতি উইন্ডো দেখতে পাবেন।
ন্যাভিগেটর উইন্ডো খুলবে, এবং আমরা বামে ওয়েবসাইট থেকে টেবিলগুলির একটি তালিকা দেখতে পাবেন। আমরা যখন একটি নির্বাচন করি, আমরা ডানদিকে একটি টেবিল পূর্বরূপ দেখতে পাবেন। চলুন ঘন ঘন ব্যবহৃত শর্টকাট টেবিল নির্বাচন করুন।
যদি আমরা আমাদের চাই টেবিলের জন্য ঘুরে দেখি তবে প্রকৃত ওয়েবসাইট দেখতে ওয়েব ভিউ ট্যাবে ক্লিক করতে পারি। আমরা এটি খুঁজে পেতে, আমরা এটি ক্লিক করতে পারেন এবং এটি আমদানি জন্য নির্বাচিত করা হবে।
এখন, আমরা এই উইন্ডোটির নীচে লোড বোতামে ক্লিক করি। অন্যান্য বিকল্প আছে যা আমরা চয়ন করতে পারি, যা আমাদের জটিল স্ক্র্যাপ করার সুযোগ বেশি জটিল এবং অতিক্রম করে। শুধু তারা আছে যে সচেতন হতে হবে। এক্সেল এর ওয়েব scraping ক্ষমতা খুব শক্তিশালী।
ওয়েব টেবিল কয়েক সেকেন্ড পর Excel এ লোড করা হবে। আমরা বামের তথ্য দেখতে পাব, যেখানে নীচের ছবিতে নম্বর 1 রয়েছে। সংখ্যা 2 ওয়েবসাইট থেকে তথ্য পেতে ব্যবহৃত প্রশ্নের হাইলাইট। যখন আমাদের একটি ওয়ার্কবুকে একাধিক প্রশ্ন থাকে, তখন আমরা এটি ব্যবহার করতে চাই এমন একটি নির্বাচন করি।
লক্ষ্য করুন যে ডেটা স্প্রেডশীটে একটি এক্সেল টেবিল হিসাবে আসে। তথ্যটি ফিল্টার বা সাজানোর জন্য এটি ইতিমধ্যে আমাদের জন্য সেট আপ করা হয়েছে।
আমরা যে সমস্ত শর্টকাটগুলি Outlook, Word, অ্যাক্সেস, পাওয়ার পয়েন্ট এবং অন্য কোনও অফিস অ্যাপ্লিকেশনের জন্য চাই তার অন্যান্য ওয়েব পৃষ্ঠাগুলির জন্য আমরা এই প্রক্রিয়াটি পুনরাবৃত্তি করতে পারি।
Excel এ স্ক্র্যাপড বর্তমান ডেটা রাখাঃ
আপনার জন্য একটি বোনাস হিসাবে, আমরা শিখতে চলেছি কীভাবে এক্সেলে আমাদের স্ক্র্যাপড ডেটা রাখা যায়। এক্সেলটি ডেটা স্ক্র্যাপিংয়ের জন্য কতটা শক্তিশালী তা কেবল চিত্রিত করার একটি দুর্দান্ত উপায়। এমনকি এই সঙ্গে, আমরা শুধুমাত্র এক্সেল করতে পারেন যে সবচেয়ে মৌলিক scraping করছেন।
এই উদাহরণের জন্য, স্টক তথ্য ওয়েব পেজটি ব্যবহার করুন যেমন https://www.cnbc.com/stocks/।
আমরা আগে যা করেছি তা দিয়ে যান এবং ঠিকানা বার থেকে নতুন URL টি অনুলিপি করে আটকান।
আপনি ন্যাভিগেটর উইন্ডোতে পাবেন এবং উপলব্ধ টেবিল দেখতে পাবেন। চলুন মেজর মার্কিন স্টক সূচক নির্বাচন করুন।
একবার তথ্য স্ক্র্যাপ করা হলে আমরা নিম্নলিখিত স্প্রেডশিট দেখতে পাবেন।
ঠিক আছে, আমরা মেজর মার্কিন স্টক সূচকগুলির জন্য অনুসন্ধানটি দেখতে পাচ্ছি। এটি হাইলাইট তাই যে নির্বাচন করুন। আমরা টেবিল সরঞ্জাম ট্যাবে এবং ডিজাইন এলাকায় নিশ্চিত করছি। তারপরে রিফ্রেশের নিচে নিচের তীরটিতে ক্লিক করুন। তারপর সংযোগ বৈশিষ্ট্য ক্লিক করুন।
কোয়েরি প্রোপার্টি উইন্ডোতে, ব্যবহার ট্যাবে, আমরা কীভাবে এই তথ্যটি রিফ্রেশ করতে পারি তা নিয়ন্ত্রণ করতে পারি। আমরা রিফ্রেশ করার জন্য একটি নির্দিষ্ট সময়ের সময় নির্ধারণ করতে পারি, বা পরের বার যখন আমরা ওয়ার্কবুক খুলতে পারি বা রিফ্রেশ করতে পারি বা পটভূমিতে রিফ্রেশ করতে পারি, অথবা এর কোনো সমন্বয়। একবার আমরা যা পছন্দ করি তা চয়ন করে, উইন্ডোটি বন্ধ করতে ও চালিয়ে যেতে ওকে ক্লিক করুন।
এটাই! এখন আপনি স্টক মূল্য, ক্রীড়া স্কোর, বা অন্য কোনও ডেটা ট্র্যাক করতে পারেন যা অ্যাক্সেস স্প্রেডশীট থেকে ঘন ঘন পরিবর্তন করে। আপনি যদি এক্সেল সমীকরণ এবং ফাংশনগুলির সাথে ভাল হন তবে আপনি ডেটাতে যেকোনো কিছু করতে পারেন।
হয়তো স্টক প্রবণতা সনাক্ত করার চেষ্টা করুন, কর্মক্ষেত্রে একটি কল্পনাপ্রসূত স্পোর্টস পুল চালান, অথবা হয়ত আবহাওয়ার ট্র্যাক রাখতে পারেন। কে জানে? আপনার কল্পনা এবং ইন্টারনেটে উপলব্ধ তথ্য, শুধুমাত্র সীমাবদ্ধ।

















পোস্টটা আমার খুব উপকারে আসবে ইনশাআল্লাহ। আমিও পাইথনে ওয়েব স্ক্র্যাপিং নিয়ে একটি টিউটোরিয়াল লিখেছি। চাইলে পড়ে দেখতে পারেন: বিউটিফুল সোপের সাথে প্রথম পরিচয়: ওয়েব স্ক্র্যাপিংয়ে হাতেখড়ি!
ReplyDelete