सभ्यता के विकास के समय मानव बहुत सी सूचनाओं को एकत्रित करना चाहता था किंतु मानव मस्तिष्क की संग्रह क्षमता बहुत कम है। यह संभव नहीं है की हर समय सभी सूचनाएं मानव मस्तिष्क में उपलब्ध हों, अतः आवश्यक है कि डाटा व सूचना को ग्रहण करने का कोई सही तरीका हो और उन्हें इस प्रकार संग्रहीत किया जाए की आवश्यकता होने पर वह उपलब्ध हो सके।
इसी क्रम में डाटा प्रक्रिया (Data Processing) का विकास हुआ। आज इनफार्मेशन टेक्नोलॉजी का चारों ओर व्यावसायिक तथा सामाजिक आवश्यकता के रूप में महत्व है। इस सूचना का आदान-प्रदान सबसे पहले टेलीफोन द्वारा तथा बाद में टेलैक्स, फैक्स, पेजर, सेल्यूलर फोन, कंप्यूटर, ई-मेल आरंभ हुआ।
विषय – सूची
डाटा प्रोसेसिंग क्या है ?
डेटा प्रोसेसिंग, डेटा को इकट्ठा करने से लेकर अनुपयोगी डेटा को उपयोगी जानकारी में बदलने की प्रक्रिया है। यह आमतौर पर एक संगठन में डेटा वैज्ञानिकों और डेटा इंजीनियरों की एक टीम द्वारा चरण-दर-चरण प्रक्रिया में किया जाता है। कच्चा डेटा एकत्र, फ़िल्टर, सॉर्ट, संसाधित, विश्लेषण, संग्रहीत और फिर एक पठनीय प्रारूप में प्रस्तुत किया जाता है।
डेटा प्रोसेसिंग किसी संगठन को अच्छी नीति बनाने के लिए अति आवश्यक होता है। डेटा प्रोसेसिंग के माध्यम से ही डेटा को उपयोगी जानकारी जैसे ग्राफ, चार्ट आदि में बदला जाता है।
डाटा (Data)
डाटा तथ्य, अंक, कल्पना प्रेक्षण अथवा घटना किसी भी रूप में हो सकते हैं। मूल रूप में डाटा वह तथ्य हैं जिन्हें किसी क्रम विशेष में जोड़ने पर उनका कोई उपयोगी अर्थ निकाला जा सकता है। उदाहरण – किसी विद्यालय में पढ़ रहे विद्यार्थियों के नाम, परीक्षा के प्राप्तांक, क्रमांक आदि डाटा कहलाते हैं। इसी तरह किसी कंपनी में कार्यरत् कर्मचारियों के नाम भी डाटा हैं।
डाटा प्रोसेसिंग के चरण (Stages of data processing)
डाटा; जैसे – अक्षर, अंक, किसी चित्र को सुव्यवस्थित करना या उनकी गणना करना प्रोसेसिंग (Processing) कहलाती है। डाटा को संकलित (Collected) कर जांचा जाता है और किसी क्रम में व्यवस्थित करने के बाद उन्हें संग्रहीत कर लिया जाता है, इसके बाद इसे विभिन्न व्यक्तियों को भेजा जाता है।
1. संकलन (Collection)
डेटा को एकत्र करना प्रोसेसिंग प्रक्रिया का सबसे पहला चरण है। डेटा को एकत्र करते समय यह ध्यान रखा जाता है की डेटा विश्वसनीय श्रोत से एकत्र किया जाए। यदि डेटा आश्वासनीय श्रोत से लिया जाएगा तो उससे प्राप्त जानकारी अथवा परिणाम भी गलत प्राप्त होंगे।
2. तैयारी (Preparation)
डेटा की तैयारी या सफाई एक प्रक्रिया है जिसमें डेटा को जांचा तथा फिल्टर किया जाता है ताकि गलत तथा अनुपयोगी डेटा को बाहर निकाला जा सके। इस प्रक्रिया में गलतियाँ जैसे डुप्लिकेट, अशुद्ध गणना, और अधूरे डेटा को खोजा जाता है इसके बाद इस डेटा को अगले चरण के लिए भेज दिया जाता है।
इस चरण का मुख्य उद्देश्य गलतियों को कम से कम करना है।
3. इनपुट (Input)
इस चरण में, कच्चे डेटा को मशीन पठनीय रूप में परिवर्तित किया जाता है और प्रोसेसिंग यूनिट में फीड किया जाता है। यह कीबोर्ड, स्कैनर या किसी अन्य इनपुट स्रोत के माध्यम से इनपुट किया जा सकता है।
4. डाटा प्रोसेसिंग
इस चरण में, कच्चे डेटा को वांछित आउटपुट उत्पन्न करने के लिए मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस एल्गोरिदम का उपयोग करके विभिन्न डेटा प्रोसेसिंग विधियों के अधीन किया जाता है।
यह चरण डाटा के श्रोत पर निर्भर करता है की किस प्रक्रिया का उपयोग किया जाएगा तथा इसके आउटपुट का उद्देश्य क्या है।
5. आउटपुट (Output)
डेटा को अंततः यूजर को समझने योग्य रूप में प्रदर्शित किया जाता है जैसे कि ग्राफ, टेबल, वेक्टर फाइलें, ऑडियो, वीडियो, दस्तावेज, आदि। इस आउटपुट को अगले डेटा प्रोसेसिंग चक्र में संग्रहीत और आगे संसाधित किया जा सकता है।
6. स्टोरेज (Storage)
डाटा प्रोसेसिंग प्रक्रिया का यह अंतिम चरण हैं जहाँ डेटा से प्राप्त जानकारी को स्टोर किया जाता है ताकि इस जानकारी को भविष्य में उपयोग किया जा सके। और अगले डेटा प्रोसेसिंग चक्र में इनपुट के रूप में उपयोग किया जा सके।
जानकारी (Information)
डाटा को यदि किसी विशेष क्रम में व्यवस्थित किया जाये तो उससे जो उपयोगी अर्थ निकाला जाता है उसे हम जानकारी या सूचना कहते हैं।
डेटा प्रोसेसिंग के सभी चरणों से गुजरने के बाद हमें जानकारी प्राप्त होती है। उदाहरण – दिये गये डाटा जैसे कि क्रमांक, विद्यार्थी संख्या, विद्यार्थी के नाम को यदि व्यवस्थित करके कक्षा में विद्यार्थियों का परिणाम (Result) निकाला जाये तथा उसे व्यवस्थित रूप में पेश किया जाये तो उसे हम जानकारी या सूचना कहते हैं।
ज्ञान (Knowledge)
वह जानकारी जो बौद्धिक होती है उसे ज्ञान कहते हैं। यह तथ्यों के आधार पर भी हो सकती है तथा अनुभव के आधार पर भी हो सकती है। वह ज्ञान जो प्रारंभिक सिद्धांतों, नियमों अथवा प्रयोगों द्वारा होता है उसे हम तथ्यों पर आधारित ज्ञान कहते हैं।
उदाहरण – एक अनुभवी इंजीनियर किताबों पर कम अपने अनुभव पर ज्यादा विश्वास करता है।
जानकारी की आवश्यकता (Need of Information)
प्रत्येक व्यक्ति को विकासशील जीवन जीने के लिए जानकारी की आवश्यकता पड़ती है क्योंकि –
- अपने आस-पास का ज्ञान प्राप्त करने के लिये यह जानना आवश्यक है कि हमारे समाज में क्या हो रहा है और समाज के बाहर दुनिया में क्या हो रहा है।
- जीवन-स्तर को उचित स्तर पर रखने के लिए, सरकार, कंपनियों के नियमों, कानूनों को जानने के लिए जानकारी की जरूरत पड़ती है।
- क्योंकि जानकारी तथ्यों पर आधारित होती है, जो कि निर्णय लेने में सहायक हो सकती है।
डाटा, जानकारी और ज्ञान में संबंध (Relationship between data, Information, and Knowledge)
डाटा, प्रोसेसिंग के बाद जानकारी (Information) में परिवर्तित हो जाता है। इस प्रकार डाटा (Data), जानकारी का आधार है। जानकारी ज्ञान को बढ़ाती है इसलिए जानकारी ज्ञान (Knowledge) का आधार जानकारी होती है। अतः डाटा, जानकारी और ज्ञान परस्पर निर्भर हैं।
डाटा पर प्रक्रिया होना और सूचना तैयार होना, मानव तक ज्ञान पहुँचाने की प्रक्रिया की प्रारंभिक स्थिति है। जानकारी के आधार पर मानव अपने कार्य को आगे बढ़ाता है। मानव का स्वभाव ज्ञान को बढ़ाते रहना है, अतः डाटा और सूचना (Information) की मानव को लगातार आवश्यकता होती है।
जानकारी के गुण (Characteristics of Information)
सूचना या जानकारी में निम्नलिखित गुण होते हैं –
1. उपलब्धता (Availability) – जानकारी का सही समय पर उपलब्ध होना ही जानकारी की सर्वप्रथम विशेषता है। इस विशेषता का लाभ उठाते हुए जानकारी से निर्णय लिए जाते हैं। अतः जानकारी की उपलब्धता आवश्यकतानुसार तुरंत उपयुक्त प्रारूप में होनी चाहिए।
2. समयबद्धता (Timely) – जानकारी ऐसी होनी चाहिए की जब उसकी आवश्यकता हो वह बिना समय नष्ट किए उपलब्ध हो जाए। इसी कारण से जानकारी की ताजगी एवं महत्व बना रहता है।
3. पूर्णता (Completeness) – जानकारी की पूर्णता ही उससे उत्पन्न होने वाले परिणाम एवं निर्णयों को सही सिद्ध करती है। यदि जानकारी अपूर्ण हो तो उससे उत्पन्न होने वाले परिणाम घातक सिद्ध हो सकते हैं। अतः वह वास्तविक जानकारी कभी नहीं मानी जा सकती है।
4. शुद्धता (Accuracy) – शुद्धता का अर्थ है शत-प्रतिशत सही जानकारी। कोई भी जानकारी कितनी शुद्ध है, यह जानकारी के प्रकार एवं उपयोग पर निर्भर करता है। उदा. बैंकिंग में आंकड़ों की शत-प्रतिशत शुद्धता।
5. सार्थकता (Meaningfulness) – यदि जानकारी का कोई अर्थ नहीं निकलता तो वह मात्र डाटा है। अतः वास्तविक जानकारी वह होती है जो कि विषय के संबंधित गुणों तथा दोषों दोनों को बताए। वही जानकारी सही अर्थों में सार्थक होती है।
6. संक्षिप्तता (Brevity) – अक्सर अत्यधिक लंबी जानकारी से असमंजसता उत्पन्न होती है, अतः जानकारी का संक्षिप्त होना किसी भी कार्य के संपादन के लिए अति महत्वपूर्ण तथा आवश्यक होता है।
7. विश्वसनीयता (Reliability) – जानकारी को यदि विभिन्न परिस्थितियों में समान रूप से प्रयोग किया जा सके, तो यह उन जानकारी का एक अति महत्वपूर्ण गुण है, जो कि विश्वसनीयता कहलाता है।
डेटा प्रोसेसिंग के प्रकार (Types of Data Processing)
डेटा के स्रोत और आउटपुट उत्पन्न करने के लिए प्रोसेसिंग यूनिट द्वारा उठाए गए कदमों के आधार पर डेटा प्रोसेसिंग के विभिन्न प्रकार होते हैं।
बैच प्रोसेसिंग (Batch Processing)
बैच प्रोसेसिंग (Batch Processing) प्रोग्रामों को कंप्यूटर में चलाने की सबसे प्राचीन विधि है। यह प्रोसेसिंग आज भी कई डाटा प्रोसेसिंग के केन्द्रों (Centres) पर कंप्यूटर से कार्य को संपन्न करवाने में प्रयुक्त की जाती है।
बैच प्रोसेसिंग (Batch Processing) में डाटा एक निश्चित समयावधि में संकलित (Collected) किया जाता है और इस डाटा पर प्रक्रिया बाद में एक बार में होती है, जैसे एक बैंक में जमा राशि, राशि की निकासी, ऋण (Loan) लेन-देन आदि को तत्काल कंप्यूटर में इनपुट कर दिया जाता है। बाद में दिन भर की सभी प्रविष्टियां (Entries) की प्रोसेसिंग कर रकम (Amount) की गणना की जाती है। यह कार्य बैच प्रोसेसिंग कहलाता है। इस प्रकार बैच प्रोसेसिंग में प्रोसेसिंग के लिए आवश्यक डाटा का संकलन लेन-देन के समय कर लिया जाता है, बाद में सभी लेन-देनों की एक साथ गणना या प्रोसेसिंग एक बार में की जाती है।
बैच प्रोसेसिंग (Batch Processing) में एक प्रकार में एक प्रोग्राम ही कंप्यूटर की केंद्रीय मेमोरी (Central Memory) में रह सकता है, जिससे यह एक प्रक्रिया प्रणाली (Single Processing System) के रूप में काम आती है अर्थात् एक बार में एक यूजर का ही कार्य संपन्न होता है।
ऑनलाइन डाटा प्रोसेसिंग (Online Data Processing)
इस डाटा प्रोसेसिंग में इनपुट – आउटपुट डिवाइसेज (I/O Devices) और द्वितीयक संग्रह डिवाइसेज (Secondary Storage Devices) सी.पी.यू (CPU) के कंट्रोल यूनिट में इस प्रकार जुड़े रहते हैं कि इन्हें कंप्यूटर किसी भी समय प्रयोग कर सके।
सी.पी.यू के नियंत्रण में प्रविष्ट किया गया डाटा, सीधे ही डिस्क (Disk) पर संग्रहीत होता है। डाटा एन्ट्री (Data Entry) के समय सीधे संपर्क में रहने वाली डिवाइसेज, आन लाइन स्टोरेज डिवाइसेज कहलाती हैं।
ऑनलाइन डाटा एन्ट्री ( Online Data Entry) के लिए इनपुट डिवाइस के उदाहरण, की-बोर्ड, स्कैनर, माइक्रोफोन आदि हैं।
ऑनलाइन प्रक्रिया में डाटा प्रविष्ट करने पर द्वितीयक संग्रह माध्यम में संग्रहीत (Stored) आंकड़े तेजी से नवीनीकृत (Update) हो जाते है। किसी भी आंकड़े की पुनः प्राप्ति (Retrieval) तेज और सीधे (Direct) होती है। आंकड़ों (Records) में संग्रहीत जानकारी को क्रमानुसार खोजे बिना, सीधे (Direct) ही कुछ क्षणों में प्राप्त किया जा सकता है।
इस प्रकार ऑनलाइन डाटा प्रोसेसिंग में यादृच्छिक (Random) और तेज गति से इनपुट कार्य होता है और तात्कालिक सीधे ही आंकड़ों को प्राप्त भी किया जा सकता है।
पारस्परिक डाटा प्रोसेसिंग ( Interactive Data Processing)
जब कंप्यूटर और यूजर (User) के मध्य सीधा संपर्क होता है और यूजर के कार्य कंप्यूटर तत्काल संपन्न करके परिणाम देता है, तो इस डाटा प्रोसेसिंग को पारस्परिक डाटा प्रोसेसिंग ( Interactive Data Processing) कहते हैं। यदि कंप्यूटर में कोई दस्तावेज (Document) तैयार किया जा रहा है, तो यह कार्य पारस्परिक डाटा प्रोसेसिंग (Interactive Data Processing) का उदाहरण है, क्योंकि यूजर कीबोर्ड से टाइप करके दस्तावेज की स्थिति लगातार स्क्रीन (Screen) पर देख रहा है; अर्थात् उसका कार्य उसे संपन्न होता हुआ दिखाई दे रहा है।
इस डाटा प्रोसेसिंग में प्रोग्रामर (Programmer) अपने प्रोग्राम (Program) को सीधे इनपुट करता है और कुछ क्षणों के बाद कंप्यूटर से उत्तर प्राप्त करता है और तब कार्य को क्रियान्वित (Execute) करने का आदेश देता है। प्रोग्रामर (Programmer) आउटपुट की जांच कर सकता है और यह निर्णय ले सकता है कि आगे क्या करना है? यदि प्रोग्राम को कंप्यूटर में टाइप (Type) करते समय कोई त्रुटि हो जाती है तो यह त्रुटि प्रोग्रामर द्वारा जांच ली जाती है और तत्काल ही सुधारी जा सकती है। इस प्रक्रिया में प्रोग्रामर गणना के पदों (Steps) को क्रिया के दौरान नियंत्रित कर सकता है।
वितरण डाटा प्रक्रिया (Distributed Data Processing)
जब अनेक कंप्यूटरों को परस्पर एक संजाल (Communication Network) से जोड़ दिया जाता है, यह एक वितरित कंप्यूटर प्रणाली (Distributed Data System) कहलाती है। इन कंप्यूटरों में जाने वाली डाटा प्रोसेसिंग (Data Processing) वितरित डाटा प्रक्रिया कहलाती है।
कंप्यूटरों के इस नेटवर्क में एक केंद्रीय कंप्यूटर होता है, जिसे सर्वर (Server) कहते हैं। सर्वर संपूर्ण नेटवर्क की विभिन्न सेवाएं सुविधाएं देता है जैसे उच्च गति का प्रिंटर, प्लॉटर (Plotter), बड़ी डिस्क (जो अधिक से अधिक डाटा स्टोर कर सके) आदि। वितरित डाटा प्रक्रिया में नेटवर्क के सभी कंप्यूटरों पर अलग-अलग यूजर अपना-अपना कार्य कर सकते हैं। आपस में डाटा का आदान-प्रदान कर सकते हैं। इसके अलावा प्रिंटर या प्लॉटर को साझा करके आउटपुट को एक ही प्रिंटर या प्लॉटर पर भेज सकते हैं। सर्वर में लगी हुई बड़ी डिस्क में डाटा और प्रोग्रामों को संग्रहीत कर सकते हैं या वहां से उसे प्राप्त भी कर सकते हैं।
इस प्रक्रिया में कार्यरत प्रत्येक कंप्यूटर या पी.सी. को क्लाइंट और केंद्रीय कंप्यूटर , जो सेवाएं प्रदान करता है उनको सर्वर कहते हैं। यह सर्वर वर्कस्टेशन भी कहलाता है। वितरित डाटा प्रक्रिया में कभी कभी अधिक संग्रह क्षमता या उच्च गति कि प्रक्रिया की आवश्यकता एक वर्कस्टेशन पूर्ण करने में सक्षम नहीं होता है। इस स्थिति में एक से अधिक वर्कस्टेशन को नेटवर्क से जोड़ दिया जाता है। और अधिक संग्रह-क्षमता या उच्च गति की प्रक्रिया की समस्या का समाधान हो जाता है।
डाटा प्रोसेसिंग की विधियाँ (Data Processing Methods)
डेटा प्रोसेसिंग के तीन मुख्य तरीके हैं – मैनुअल, मैकेनिकल और इलेक्ट्रॉनिक।
मैनुअल डाटा प्रोसेसिंग
इस विधि के अंतर्गत डाटा प्रोसेसिंग (Data Processing) मैन्युअली की जाती है। पूरी प्रक्रिया डाटा कलेक्शन से लेकर फिल्टरिंग, गणनाएं, संग्रह सभी की सभी क्रियाएं मानव की देखरेख में की जाती हैं इसमें किसी भी प्रकार का मशीनी हस्तक्षेप नहीं होता है।
यह एक कम लागत वाली विधि है और इसके लिए बहुत कम या बिना किसी उपकरण की आवश्यकता होती है परंतु इसमें गलतियों की संभावना भी अधिक होती है।
मैकेनिकल डाटा प्रोसेसिंग (Mechanical Data Processing)
इस प्रक्रिया में डाटा प्रोसेसिंग के लिए डिवाइसेज और मशीनों का उपयोग किया जाता है। इनमें कैलकुलेटर, टाइपराइटर, प्रिंटर आदि डिवाइस शामिल हो सकते हैं। इस विधि के माध्यम से सामान्य डाटा प्रोसेसिंग (Data Processing) की जा सकती है। इसमें मैनुअल डेटा प्रोसेसिंग की तुलना में बहुत कम त्रुटियां होती हैं, लेकिन डेटा की मात्रा बढ़ जाने से यह प्रक्रिया भी कभी लंबी और कठिन हो सकती है।
इलेक्ट्रॉनिक डेटा प्रोसेसिंग (Electronic Data Processing)
इस विधि में डेटा प्रोसेसिंग सॉफ्टवेयर और प्रोग्राम का उपयोग करके डेटा को आधुनिक तकनीकों के साथ प्रोसेस किया जाता है। इस प्रक्रिया में सॉफ्टवेयर में कुछ निर्देश फीड किए जाते हैं उन्हीं निर्देशों के आधार पर सॉफ्टवेयर परिणाम प्रस्तुत करता है।
यह विधि सबसे खर्चीली है लेकिन अधिक विश्वसनीय भी है। इस विधि में आउटपुट अधिक तेजी से और शुद्ध प्राप्त होता है।