معرفی Apache HBase برنامه هایی مانند HBase، Cassandra، couchDB، Dynamo و MongoDB برخی از پایگاه های داده ای هستند که مقادیر زیادی از داده ها را ذخیره می کنند و به صورت تصادفی به داده ها دسترسی دارند. HBase یک پایگاه داده مبتنی بر ستون توزیع شده می باشد که در بالای سیستم فایل Hadoop ساخته شده است. HBase یک پروژه منبع باز بوده و به صورت افقی قابل مقیاس پذیری است. HBase یک مدل داده ای است که شبیه big table گوگل است که برای دسترسی سریع به مقادیر عظیم داده های ساخت یافته طراحی شده است. همچنین HBase بار سیستم فایل هدوپ را تحمل می کند. در واقع HBase بخشی از اکوسیستم Hadoop است که دسترسی تصادفی به خواندن و نوشتن در زمان واقعی را در سیستم فایل Hadoop را فراهم می کند. می توان داده ها را در HDFS به طور مستقیم یا از طریق HBase ذخیره کرد. مصرف کننده داده با استفاده از HBase می تواند به داده ها در HDFS دسترسی پیدا می کند یا انها را بخواند. HBase در بالای سیستم فایل Hadoop نشسته و دسترسی و خواندن و نوشتن را فراهم می کند. ویژگی های HBase
- منبع باز
- ساخته شده در بالای HDFS
- ارائه جستجوی سریع برای جداول بزرگتر
- دسترسی به ردیف های تکمیلی از میلیاردها رکورد (دسترسی تصادفی)
- استفاده از جداول Hash به منظور دسترسی تصادفی
- ذخیره داده ها در فایل های HDFS برای جستجوی سریع تر
- به صورت خطی مقیاس پذیر
- پشتیبانی از شکست خودکار
- ادغام با Hadoop، هر دو به عنوان منبع و یک مقصد
- دارای API جاوا آسان برای کلاینت
- تکرار داده ها را در میان cluster ها