कैसे बिग डेटा अगली पीढ़ी के गैर संबंधपरक डेटाबेस जन्म पैदा
द्वारा व्यवस्थापक
10 साल पहले, गूगल एक समस्या थी. वे लगातार, spidering गया अनुक्रमण और कैशिंग जो एक घातीय दर से बढ़ रहा था एक इंटरनेट पर हर पृष्ठ. इस के अलावा, वे इस डेटा की एक विशाल और बढ़ती शरीर पर परिष्कृत गणना, प्रकार और खोजों प्रदर्शन की उम्मीद थी.
पारंपरिक संबंधपरक डेटा अड्डों संरचित डेटा का उपयोग करने के लिए जटिल लेनदेन प्रदर्शन करने के लिए डिजाइन किए हैं. लेकिन वहाँ स्केलिंग सीमा रहे हैं. Petabyte श्रेणी में एक डेटा की दुकान के कदम के रूप में, ठेठ संचालन के लिए बहुत लंबे समय तक लेने के लिए और संसाधनों की बहुत सारी खाने लगते हैं. इसके अलावा, संबंधपरक डेटाबेस एकाधिक डेटा स्रोतों से गंदा, असंरचित डेटा की भावना बनाने के लिए अव्यावहारिक है.
एक नए दृष्टिकोण की जरूरत थी.
संबंधपरक डेटाबेस को पूरी तरह छोड़, और जो वे "बिगटेबल" कहा जाता है एक पूरी तरह से नई पद्धति विकसित करके इस समस्या से निपटने की कोशिश की थी. विचार के लिए एक बहुत आसान तरीका में अपने डेटा के सभी संरचना, और फिर कई नोड्स भर में इस जानकारी को तोड़ने.
पुराने स्कूल की कार्यप्रणाली के साथ, डेटाबेस प्रसंस्करण के सभी केंद्रीकृत था. लेकिन नए गैर संबंधपरक या "MapReduce" तरीके के साथ, प्रसंस्करण कई "नोड" जो प्रत्येक अपने स्वयं के भंडारण और प्रसंस्करण क्षमताओं के खिलाफ वितरित किया जाता है.
बड़ी डेटा स्टोर के प्रबंधन के लिए इस दृष्टिकोण है कि पूरी तरह से संगत जानकारी की आवश्यकता नहीं है अनुप्रयोगों के लिए आदर्श है. उदाहरण के लिए, एक मानचित्रण कार्यक्रम या एक मौसम रिपोर्ट में छोटे अशुद्धियों को स्वीकार्य हो सकता है. अनुप्रयोग जो डेटा प्रबंधन की इस नई नस्ल को अच्छी तरह से अनुकूल हैं के लिए, इन मामूली विसंगतियों प्रदर्शन में बढ़ावा देने के द्वारा सेट की तुलना में अधिक कर रहे हैं.
दूसरी ओर, एक वित्तीय रिपोर्टिंग प्रणाली में मामूली अशुद्धियों को स्वीकार्य नहीं हो सब पर होगा. तो अनुप्रयोगों के इन प्रकार के संबंधपरक डेटाबेस के डोमेन होना जारी रहेगा.
इन गैर संबंधपरक डेटाबेस का एक अन्य लाभ है कि वे बड़ी समस्याओं जो नोड्स के हजारों लोगों ने एक साथ हमला किया जा सकता है छोटे टुकड़ों में टूट की अनुमति है. इसका मतलब यह है कि जटिल आँकड़े और डेटा की बहुत बड़ी मात्रा पर डेटा विश्लेषण किया जा सकता है बहुत जल्दी से प्रदर्शन कर सकते हैं. यह मशीन सीखने, कृत्रिम बुद्धि, चेहरा पहचान और डेटा हेरफेर के अन्य प्रकार है जो असंभव हो गया होता है या बहुत पारंपरिक तरीके का उपयोग धीमी गति के क्षेत्रों में नए उद्योगों की जन्म पैदा की है.
गैर संबंधपरक डेटाबेस तकनीक में सबसे नई बात कर रहे हैं. यह वही तकनीक है कि याहू, Facebook, चहचहाना और सबसे शुरू अप के कई तरह शक्तियों साइटों. हम भी NoSQL, Hadoop, Cassandra और प्रौद्योगिकियों जो इस अंतरिक्ष शक्ति के कई में अनुभव के साथ प्रोग्रामर के लिए मांग में एक कील देख रहे हैं.
गैर संबंधपरक डेटाबेस से अधिक सिर्फ एक नए उपकरण हैं. यह जिस तरह से हम जानकारी के साथ काम में एक बुनियादी बदलाव होने जा रहा है.
संबंधित पोस्ट:
















सॉफ्टवेयर एजी
मार्च 27th, 2012
जैसा कि आप का उल्लेख करने के लिए, एक व्यापार की जरूरत है अगर वे मामूली अशुद्धियों को संभाल सकता है हुक्म चलाना होगा. यह सब तुम क्या व्यापार के लक्ष्यों को प्राप्त करने के लिए और जहाँ आप और अधिक कुशल हो सकता है (और क्या आप ऐसा करने के लिए बलिदान हो सकता है) के लिए काम कर रहे हैं करने के लिए नीचे आता है.