
به لطف ابر، حجم داده ای که تولید و ذخیره می شود در مقیاس و حجم منفجر می شود.
هر جنبه ای از سازمان برای داده ها مفید است، بنابراین عملیات جدید بر روی آن داده ها ساخته می شود، که هر شرکت را تشویق می کند تا به یک شرکت داده تبدیل شود.
یکی از عمیق ترین و شاید نامشخص ترین تغییراتی که منجر به این امر شده است، ظهور پایگاه داده ابری است. خدماتی مانند Amazon S3، Google BigQuery، Snowflake و Databricks محاسبات حجم زیادی از داده ها را حل کرده اند و ذخیره داده ها را از هر منبع موجود آسان کرده اند.
این شرکت میخواهد هر چیزی را که میتواند حفظ کند، به این امید که تجربه بهتری برای مشتری و فرصتهای جدید بازار فراهم کند.
زمان خوبی برای یک شرکت پایگاه داده است
بر اساس گزارش CB Insights، شرکت های پایگاه داده در 10 سال گذشته بیش از 8.7 میلیارد دلار جمع آوری کرده اند که تقریباً نیمی از آن یعنی 4.1 میلیارد دلار تنها در 24 ماه گذشته است.
با توجه به رتبه بندی بالای Snowflake و Databricks جای تعجب نیست. این بازار در چهار سال گذشته دو برابر شده و به تقریباً 90 میلیارد دلار رسیده است و انتظار می رود در چهار سال آینده دوباره دو برابر شود. به جرات می توان گفت که یک فرصت بزرگ وجود دارد.
برای لیست کاملی از بودجه پایگاه داده در سال 2021 اینجا را ببینید.

رشد پایگاه داده باعث تحریک هزینه ها در شرکت می شود. اعتبار تصویر: ونراک
20 سال پیش شما یک گزینه داشتید: پایگاه داده رابطه ای
امروزه، به لطف ابر، میکروسرویس ها، برنامه های کاربردی توزیع شده، مقیاس جهانی، داده های بلادرنگ و آموزش عمیق، معماری های پایگاه داده جدیدی برای پاسخگویی به الزامات عملکرد جدید پدید آمده اند.
ما قبلاً سیستم های مختلفی برای تندخوانی و نوشتن سریع داریم. همچنین سیستمهایی بهطور خاص برای تغذیه تحلیلهای موقت یا برای دادههای بدون ساختار، نیمه ساختاریافته، تراکنشی، رابطهای، گرافیکی یا سریهای زمانی، و همچنین برای دادههای مورد استفاده برای ذخیرهسازی، جستجو، بر اساس نمایهها، رویدادها و موارد دیگر وجود دارد. .
ممکن است تعجب آور باشد، اما هنوز میلیاردها دلار در نمونه های Oracle وجود دارد که هنوز برنامه های کاربردی حیاتی را امروز تامین می کند و احتمالاً به جایی نخواهند رسید.
هر سیستم دارای نیازهای عملکردی متفاوتی است، از جمله در دسترس بودن بالا، مقیاس افقی، ثبات توزیع شده، حفاظت از شکست، تحمل پارتیشن، و بدون سرور و کاملاً مدیریت شده.
در نتیجه، شرکت ها به طور متوسط داده ها را در هفت پایگاه داده یا بیشتر ذخیره می کنند. برای مثال، ممکن است Snowflake را به عنوان انبار داده خود، Clickhouse برای تجزیه و تحلیل ad-hoc، Timescale برای داده های سری زمانی، Elastic برای داده های جستجوی آنها، S3 برای داده های جستجوی آنها، S3 برای گزارش ها، Postgres برای تراکنش ها، Redis برای ذخیره سازی یا برنامه کاربردی داشته باشید. داده ها، Cassandra برای بارهای کاری پیچیده و Dgraph * برای داده های اتصال یا مدارهای پویا.
این همه است، با فرض اینکه در فضای ابری هستید و یک پشته داده مدرن از ابتدا ساخته اید.
سطح عملکرد و ضمانتهای این خدمات و پلتفرمها در سطح بسیار متفاوتی با پنج تا ۱۰ سال پیش است. در عین حال، تکثیر و تکه تکه شدن لایه پایگاه داده به طور فزاینده ای چالش های جدیدی را ایجاد می کند.
به عنوان مثال، همگامسازی بین طرحوارهها و سیستمهای مختلف، نوشتن کارهای جدید ETL برای غلبه بر بار کاری در پایگاههای اطلاعاتی متعدد، مشکلات ارتباط متقابل و اتصال دائمی، سربار برای مدیریت یک خوشه فعال فعال در بسیاری از سیستمهای مختلف، یا انتقال دادهها در هنگام خوشههای جدید یا سیستم ها آنلاین می شوند هر کدام نیازمندی های متفاوتی برای مقیاس بندی، انشعاب، توزیع، تقسیم و منابع دارند.
علاوه بر این، ما اکنون هر ماه پایگاههای اطلاعاتی جدیدی داریم که هدف آن رسیدگی به چالش بعدی شرکت است.
پایگاه داده جدید
بنابراین سوال این است که آیا آینده پایگاه داده همچنان به شکل امروزی تعریف خواهد شد؟