多大的數據催生了新一代的非關係型數據庫的誕生

10年前,谷歌有一個問題。 他們不斷地蜘蛛,索引和緩存的每一頁上互聯網,這是在以指數增長。 除了這個,他們預計這個龐大和不斷增長的數據體上執行複雜的計算,排序和搜索。

傳統的關係數據基地的設計使用結構化數據進行複雜的交易。 但也有擴展限制。 作為一個數據存儲移動到PB的範圍內,典型的操作開始花費更長的時間和吃了大量資源。 另外,關係型數據庫是不切實際的凌​​亂的非結構化數據,從多個數據源的意義。

一種新的方法是必要的。

谷歌曾試圖處理這個問題,完全放棄關係型數據庫,並開發了一個全新的方法,他們稱之為“BigTable的”。 當時的想法是一個非常簡單的方法,其數據結構,然後打破這種跨多個節點的信息。

與老派的方法,所有的數據庫處理是集中的。 但與非關聯或“新的MapReduce”的方法,處理分佈對許多“節點”,它們都有自己的存儲和處理能力。

這種管理大型數據存儲的方法,是理想的應用程序不要求絕對一致的信息。 例如,映射程序或天氣報告不準確,可能是可以接受的。 這是非常適合於這種數據管理的新品種的應用,這些小的矛盾是超過在性能提升的設置。

另一方面,在財務報告制度的輕微誤差不會接受。 因此,這些類型的應用將繼續成為關係數據庫領域。

這些非關係型數據庫的另一個好處是,他們讓大問題分解成小件由上千個節點,同時可以攻擊。 這意味著極大量的數據,很快可以進行複雜的統計和數據分析。 這催生新的產業領域在機器學習,人工智能,人臉識別和數據處理的其他類型,這已不可能或非常緩慢,用傳統的方法的誕生。

非關係數據庫是最熱門的高科技新事物。 這是相同的技術,網站如雅虎,Facebook,Twitter和許多最熱門的新的初創企業的權力。 我們也看到了NoSQL的,Hadoop的,卡桑德拉和許多權力這個空間技術有經驗的程序員的尖峰需求。

非關係型數據庫的不僅僅是一個新的工具。 這將是在我們的工作與信息的方式的根本性轉變。

相關文章:

  1. 備份數據庫時面臨的最大挑戰
  2. 如何寫一個IT諮詢服務的首席代信
  3. 除了 ​​重複數據刪除:實施一項全面的數據保護策略,以滿足今天的數據需求
  4. 歸檔數據呈指數級增長的時期數據的重要作用

“多大的數據催生了新一代的非關係型數據庫的誕生”

  1. Software AG公司

    3月第27屆,2012年

    至於你提到的,一個企業的需求將決定,如果他們能處理輕微的不準確。 這一切都歸結到你的工作業務目標實現,在那裡你可以變得更有效率(和你可能要犧牲這樣做)。

發表評論


網站(可選)