آموزش Apache HBase

معرفی Apache HBase برنامه هایی مانند HBase، Cassandra، couchDB، Dynamo و MongoDB برخی از پایگاه های داده ای هستند که مقادیر زیادی از داده ها را ذخیره می کنند و به صورت تصادفی به داده ها دسترسی دارند. HBase یک پایگاه داده مبتنی بر ستون توزیع شده می باشد که در بالای سیستم فایل Hadoop ساخته شده است. HBase یک پروژه منبع باز بوده و به صورت افقی قابل مقیاس پذیری است. HBase یک مدل داده ای است که شبیه big table گوگل است که برای دسترسی سریع به مقادیر عظیم داده های ساخت یافته طراحی شده است. همچنین HBase بار سیستم فایل هدوپ را تحمل می کند. در واقع HBase بخشی از اکوسیستم Hadoop است که دسترسی تصادفی به خواندن و نوشتن در زمان واقعی را در سیستم فایل Hadoop را فراهم می کند. می توان داده ها را در HDFS به طور مستقیم یا از طریق HBase ذخیره کرد. مصرف کننده داده با استفاده از HBase می تواند به داده ها در HDFS دسترسی پیدا می کند یا انها را بخواند. HBase در بالای سیستم فایل Hadoop نشسته و دسترسی و خواندن و نوشتن را فراهم می کند. ویژگی های HBase

منبع باز
ساخته شده در بالای HDFS
ارائه جستجوی سریع برای جداول بزرگتر
دسترسی به ردیف های تکمیلی از میلیاردها رکورد (دسترسی تصادفی)
استفاده از جداول Hash به منظور دسترسی تصادفی
ذخیره داده ها در فایل های HDFS برای جستجوی سریع تر
به صورت خطی مقیاس پذیر
پشتیبانی از شکست خودکار
ادغام با Hadoop، هر دو به عنوان منبع و یک مقصد
دارای API جاوا آسان برای کلاینت
تکرار داده ها را در میان cluster ها

کاربرد HBase Apache HBase برای دسترسی به اطلاعات بی نظیر در زمان واقعی به خواندن و نوشتن استفاده می شود. Apache HBase برای دسترسی تصادفی، خواندن یا نوشتن بیگ دیتا در زمان واقعی استفاده می شود. HBase از جدول های بزرگ بالای کلاستر های نرم افزار میزبانی می کند. Apache HBase یک پایگاه داده غیر رابطه ای است که بعد از Bigtable گوگل طراحی شده است. Bigtable در سیستم فایل Google عمل می کند، Apache HBase در بالای Hadoop و HDFS کار می کند. در زمان نیاز به نوشتن برنامه های کاربردی سنگین استفاده می شود. هر وقت که نیاز به دسترسی تصادفی سریع به داده های موجود باشد. شرکت هایی مانند فیسبوک، توییتر، یاهو و Adobe از HBase استفاده می کنند.

نظرتون درباره این نوشته چیه؟ عالیه بد نیست خوب نبود