منو سایت

این آغاز عصر پایگاه‌های داده بدون محدودیت است

 تاریخ انتشار :
/
  اخبار استارتاپ
Log4Shell برای هک سرورهای VMWare استفاده می شود

به لطف ابر، حجم داده ای که تولید و ذخیره می شود در مقیاس و حجم منفجر می شود.

هر جنبه ای از سازمان برای داده ها مفید است، بنابراین عملیات جدید بر روی آن داده ها ساخته می شود، که هر شرکت را تشویق می کند تا به یک شرکت داده تبدیل شود.

یکی از عمیق ترین و شاید نامشخص ترین تغییراتی که منجر به این امر شده است، ظهور پایگاه داده ابری است. خدماتی مانند Amazon S3، Google BigQuery، Snowflake و Databricks محاسبات حجم زیادی از داده ها را حل کرده اند و ذخیره داده ها را از هر منبع موجود آسان کرده اند.

این شرکت می‌خواهد هر چیزی را که می‌تواند حفظ کند، به این امید که تجربه بهتری برای مشتری و فرصت‌های جدید بازار فراهم کند.

زمان خوبی برای یک شرکت پایگاه داده است

بر اساس گزارش CB Insights، شرکت های پایگاه داده در 10 سال گذشته بیش از 8.7 میلیارد دلار جمع آوری کرده اند که تقریباً نیمی از آن یعنی 4.1 میلیارد دلار تنها در 24 ماه گذشته است.

با توجه به رتبه بندی بالای Snowflake و Databricks جای تعجب نیست. این بازار در چهار سال گذشته دو برابر شده و به تقریباً 90 میلیارد دلار رسیده است و انتظار می رود در چهار سال آینده دوباره دو برابر شود. به جرات می توان گفت که یک فرصت بزرگ وجود دارد.

برای لیست کاملی از بودجه پایگاه داده در سال 2021 اینجا را ببینید.

رشد پایگاه داده باعث تحریک هزینه ها در شرکت می شود

رشد پایگاه داده باعث تحریک هزینه ها در شرکت می شود. اعتبار تصویر: ونراک

20 سال پیش شما یک گزینه داشتید: پایگاه داده رابطه ای

امروزه، به لطف ابر، میکروسرویس ها، برنامه های کاربردی توزیع شده، مقیاس جهانی، داده های بلادرنگ و آموزش عمیق، معماری های پایگاه داده جدیدی برای پاسخگویی به الزامات عملکرد جدید پدید آمده اند.

ما قبلاً سیستم های مختلفی برای تندخوانی و نوشتن سریع داریم. همچنین سیستم‌هایی به‌طور خاص برای تغذیه تحلیل‌های موقت یا برای داده‌های بدون ساختار، نیمه ساختاریافته، تراکنشی، رابطه‌ای، گرافیکی یا سری‌های زمانی، و همچنین برای داده‌های مورد استفاده برای ذخیره‌سازی، جستجو، بر اساس نمایه‌ها، رویدادها و موارد دیگر وجود دارد. .

ممکن است تعجب آور باشد، اما هنوز میلیاردها دلار در نمونه های Oracle وجود دارد که هنوز برنامه های کاربردی حیاتی را امروز تامین می کند و احتمالاً به جایی نخواهند رسید.

هر سیستم دارای نیازهای عملکردی متفاوتی است، از جمله در دسترس بودن بالا، مقیاس افقی، ثبات توزیع شده، حفاظت از شکست، تحمل پارتیشن، و بدون سرور و کاملاً مدیریت شده.

در نتیجه، شرکت ها به طور متوسط ​​داده ها را در هفت پایگاه داده یا بیشتر ذخیره می کنند. برای مثال، ممکن است Snowflake را به عنوان انبار داده خود، Clickhouse برای تجزیه و تحلیل ad-hoc، Timescale برای داده های سری زمانی، Elastic برای داده های جستجوی آنها، S3 برای داده های جستجوی آنها، S3 برای گزارش ها، Postgres برای تراکنش ها، Redis برای ذخیره سازی یا برنامه کاربردی داشته باشید. داده ها، Cassandra برای بارهای کاری پیچیده و Dgraph * برای داده های اتصال یا مدارهای پویا.

این همه است، با فرض اینکه در فضای ابری هستید و یک پشته داده مدرن از ابتدا ساخته اید.

سطح عملکرد و ضمانت‌های این خدمات و پلتفرم‌ها در سطح بسیار متفاوتی با پنج تا ۱۰ سال پیش است. در عین حال، تکثیر و تکه تکه شدن لایه پایگاه داده به طور فزاینده ای چالش های جدیدی را ایجاد می کند.

به عنوان مثال، همگام‌سازی بین طرح‌واره‌ها و سیستم‌های مختلف، نوشتن کارهای جدید ETL برای غلبه بر بار کاری در پایگاه‌های اطلاعاتی متعدد، مشکلات ارتباط متقابل و اتصال دائمی، سربار برای مدیریت یک خوشه فعال فعال در بسیاری از سیستم‌های مختلف، یا انتقال داده‌ها در هنگام خوشه‌های جدید یا سیستم ها آنلاین می شوند هر کدام نیازمندی های متفاوتی برای مقیاس بندی، انشعاب، توزیع، تقسیم و منابع دارند.

علاوه بر این، ما اکنون هر ماه پایگاه‌های اطلاعاتی جدیدی داریم که هدف آن رسیدگی به چالش بعدی شرکت است.

پایگاه داده جدید

بنابراین سوال این است که آیا آینده پایگاه داده همچنان به شکل امروزی تعریف خواهد شد؟