डाटा माइनिंग

डेटा माइनिंग क्या है:

डाटा माइनिंग कंप्यूटर विज्ञान से जुड़ा एक अंग्रेजी शब्द है जिसका अनुवाद डेटा माइनिंग है । इसमें एक कार्यक्षमता होती है जो डेटा को संयोजित और व्यवस्थित करती है, उन्हें प्रासंगिक पैटर्न, संघों, परिवर्तनों और विसंगतियों में खोजती है

डेटाबेस समुदायों में 1990 में डेटा माइनिंग शब्द पहली बार उभरा। डेटा माइनिंग एक प्रक्रिया विश्लेषण चरण है जिसे केडीडी ( डेटाबेस में ज्ञान डिस्कवरी ) के रूप में जाना जाता है, इसका शाब्दिक अनुवाद "ज्ञान डिस्कवरी इन डेटाबेस" है।

डेटा माइनिंग को कुछ बुनियादी चरणों में विभाजित किया जा सकता है: अन्वेषण, मॉडल बिल्डिंग, पैटर्न परिभाषा और सत्यापन और सत्यापन।

कंप्यूटिंग की दुनिया में डेटा माइनिंग एक अपेक्षाकृत हालिया अभ्यास है, और यह विभिन्न डेटा के बीच सहसंबंधों की खोज करने के लिए सूचना पुनर्प्राप्ति, कृत्रिम बुद्धिमत्ता, पैटर्न मान्यता और सांख्यिकीय तकनीकों का उपयोग करता है जो आपको किसी कंपनी या व्यक्ति के लिए लाभकारी ज्ञान प्राप्त करने में सक्षम बनाता है। एक कंपनी के लिए, डेटा माइनिंग एक महत्वपूर्ण उपकरण हो सकता है जो नवाचार और लाभप्रदता को बढ़ाता है।

बड़े डेटाबेस में डेटा माइनिंग का उपयोग काफी आम है, और उनके उपयोग का अंतिम परिणाम नियमों, परिकल्पनाओं, निर्णय पेड़ों, डेंड्रोग्राम्स, आदि के माध्यम से प्रदर्शित किया जा सकता है।

अच्छी तरह से निष्पादित डेटा खनन को ऐसे कार्यों को पूरा करना चाहिए: विसंगति का पता लगाना, एसोसिएशन रूल लर्निंग (निर्भरता मॉडलिंग), क्लस्टरिंग, वर्गीकरण, प्रतिगमन और सारांश। डेटा माइनिंग प्रक्रिया आमतौर पर डेटा वेयरहाउस के भीतर मौजूद डेटा का उपयोग करके होती है।

कई कंपनियां और सॉफ्टवेयर हैं जो डेटा माइनिंग को समर्पित हैं, क्योंकि डेटाबेस में पैटर्न की पहचान तेजी से महत्वपूर्ण है। हालांकि, प्रासंगिक मानकों की पहचान कंप्यूटर की दुनिया के लिए अद्वितीय नहीं है। मानव मस्तिष्क पैटर्न की पहचान करने और ज्ञान प्राप्त करने के लिए एक समान प्रक्रिया का उपयोग करता है।

हाल के वर्षों में, विज्ञान और इंजीनियरिंग जैसे जैव सूचना विज्ञान, आनुवंशिकी, चिकित्सा, शिक्षा और इलेक्ट्रिकल इंजीनियरिंग के क्षेत्रों में डेटा खनन का व्यापक रूप से उपयोग किया गया है।

डेटा खनन की अवधारणा अक्सर लोगों के व्यवहार के बारे में जानकारी निकालने से जुड़ी होती है। इस कारण से, कुछ स्थितियों में, डेटा खनन कानूनी मुद्दों और गोपनीयता और नैतिकता से संबंधित मुद्दों को उठाता है। इसके बावजूद, कई लोग दावा करते हैं कि डेटा खनन नैतिक रूप से तटस्थ है क्योंकि इसका कोई नैतिक प्रभाव नहीं है।

रियल डाटा माइनिंग उदाहरण

डेटा माइनिंग का उपयोग अक्सर उपयोगकर्ता / कर्मचारी / ग्राहकों के बारे में ज्ञान प्राप्त करने के लिए कंपनियों और संगठनों द्वारा किया जाता है। उदाहरण के लिए, सार्वजनिक क्षेत्र में किसी कर्मचारी की वैवाहिक स्थिति और उसके द्वारा अर्जित वेतन के बीच क्रॉस-चेक करना संभव है, यह देखने के लिए कि क्या उसके वैवाहिक जीवन पर इसका प्रभाव है।

सुपरमार्केट चेन जैसी कंपनियां इस क्रॉस-डेटा का उपयोग उन उत्पादों को निर्धारित करने के लिए कर सकती हैं जो एक साथ खरीदे जाते हैं। यदि कोई ग्राहक जो उत्पाद X खरीदता है, वह उत्पाद Y भी खरीदता है, तो ग्राहक को खरीदना आसान बनाने के लिए आस-पास के दो उत्पादों को स्थान देना एक अच्छा विचार हो सकता है।