منو سایت

  • خانه
  • اخبار استارتاپ
  • به نظر می‌رسد Encord که تازه‌وارد در برچسب‌گذاری داده‌های هوش مصنوعی است، در حال افزایش موجی است

به نظر می‌رسد Encord که تازه‌وارد در برچسب‌گذاری داده‌های هوش مصنوعی است، در حال افزایش موجی است

 تاریخ انتشار :
/
  اخبار استارتاپ
Log4Shell برای هک سرورهای VMWare استفاده می شود

قبل از اینکه بتوانید به ساخت الگوریتمی برای خواندن اشعه ایکس یا تفسیر یک اسمیر خون فکر کنید، دستگاه باید بداند در تصویر چه چیزی وجود دارد. کل وعده هوش مصنوعی در مراقبت های بهداشتی، حوزه ای که 11.3 میلیارد دلار سرمایه گذاری خصوصی را در سال 2021 جذب کرد، بدون مجموعه داده های برچسب گذاری شده دقیق که به ماشین ها می گوید دقیقاً به دنبال چه چیزی هستند، قابل تحقق نیست.

ایجاد این مجموعه داده‌های برچسب‌گذاری‌شده در حال تبدیل شدن به خود صنعتی است که می‌تواند به شرکت‌هایی که در شمال وضعیت تک‌شاخ هستند، ببالند. امروز، Encord، یک استارت آپ کوچک که به تازگی از Y Combinator ظهور کرده است، به دنبال شرکت در این اقدام است. به منظور تولید مجموعه داده های برچسب گذاری شده برای پروژه های بینایی کامپیوتری، Encord نسخه بتای خود را از یک برنامه برچسب گذاری به کمک هوش مصنوعی به نام CordVision منتشر کرده است. این راه اندازی به دنبال برنامه های آزمایشی در پزشکی استنفورد، مموریال اسلون کترینگ و کینگز کالج لندن است. همچنین توسط Kheiron Medical و Viz AI آزمایش شده است.

Encord مجموعه‌ای از ابزارها را توسعه داده است که به رادیولوژیست‌ها اجازه می‌دهد تصاویر DICOM را بزرگ‌نمایی کنند، قالبی که عموماً برای انتقال تصاویر پزشکی استفاده می‌شود. و به جای اینکه یک رادیولوژیست بنشیند و کل تصویر را حاشیه نویسی کند، نرم افزار طوری طراحی شده است که اطمینان حاصل شود که فقط قسمت های کلیدی تصویر برچسب گذاری می شوند.

Encord در سال 2020 توسط اریک لاندو با تجربه در فیزیک کاربردی و اولریک استیگ هانسن تاسیس شد. هانسن روی یک پروژه پایان نامه کارشناسی ارشد در کالج امپریال لندن کار می کرد که بر روی تجسم مجموعه داده های بزرگ برای تصاویر پزشکی تمرکز داشت. این هانسن بود که برای اولین بار متوجه شد که چقدر طول می کشد تا مجموعه داده های برچسب گذاری شده را مدیریت کند.

این مجموعه داده‌های برچسب‌گذاری‌شده مهم هستند زیرا «حقایق اولیه» را ارائه می‌کنند که الگوریتم‌ها می‌توانند از آن بیاموزند. راه‌هایی برای ساخت هوش مصنوعی وجود دارد که به مجموعه داده‌های برچسب‌گذاری شده نیاز ندارد، اما تا حد زیادی هوش مصنوعی (به‌ویژه در مراقبت‌های بهداشتی) به آموزش کنترل‌شده‌ای متکی است که به آن‌ها نیاز دارد.

برای ایجاد یک مجموعه داده برچسب‌دار، بیش از یک پزشک به معنای واقعی کلمه تصاویر را یکی یکی مرور می‌کنند و چند ضلعی‌ها را در اطراف ویژگی‌های مربوطه ترسیم می‌کنند. در موارد دیگر می توان آن را با ابزارها یا حسگرهای منبع باز انجام داد. اما به هر حال، ادبیات علمی نشان می دهد که این گام یک مانع بزرگ در دنیای هوش مصنوعی در مراقبت های بهداشتی است، به ویژه در رادیولوژی، که یکی از زمینه هایی است که پیش بینی می شود هوش مصنوعی در آن پیشرفت های بزرگی داشته باشد، اما تا حد زیادی موفق به انجام آن نشد. تغییرات پارادایم اصلی .

«می دانم که شک و تردید زیادی وجود دارد [of AI in the medical world]. لاندو به TechCrunch گفت: “ما فکر می کنیم پیشرفت واقعا کند است.” ما معتقدیم که حرکت به سمت رویکردی که در وهله اول واقعاً به داده‌های آموزشی فکر می‌کنید، به سرعت بخشیدن به توسعه این مدل‌ها کمک می‌کند.»

به گفته نویسندگان یک مقاله در سال 2021 در Frontiers in Radiology، برچسب‌ها به 24 سال کار نیاز دارند تا مجموعه داده‌ای از حدود 100000 تصویر را برچسب‌گذاری کنند. بیانیه موضع دیگری در سال 2021 که توسط انجمن اروپایی پزشکی هسته ای (EANM) و انجمن اروپایی تصویربرداری قلبی عروقی (EACVI) منتشر شد، خاطرنشان می کند که “به دست آوردن داده های برچسب گذاری شده در تجزیه و تحلیل تصویربرداری پزشکی می تواند زمان و تلاش لازم را داشته باشد. گران است.” اما او همچنین خاطرنشان می کند که تکنیک های جدیدی در حال ظهور هستند که می توانند کارها را سرعت بخشند.

Log4Shell برای هک سرورهای VMWare استفاده می شود

اعتبار تصویر: پلت فرم برچسب زدن DICOM را ضبط کنید

از قضا، این تکنیک های جدید به خودی خود نسخه هایی از هوش مصنوعی هستند. به عنوان مثال، سند مرزها در رادیولوژی از سال 2021، نشان داد که با استفاده از یک رویکرد یادگیری فعال، فرآیند می تواند 87٪ سریعتر باشد. برای بازگشت به نمونه 100000 تصویر، تنها 3.2 سال کاری طول می کشد، در مقابل 24 سال.

CordVision اساساً نسخه ای از یک فرآیند یادگیری فعال به نام مدل سازی میکرو است. به طور کلی، این تکنیک توسط تیمی کار می کند که نمونه کوچک و معرف تصاویر را علامت گذاری می کند. سپس هوش مصنوعی خاص بر روی این تصاویر آموزش داده می شود و سپس در استخر وسیع تری که هوش مصنوعی برچسب گذاری می کند اعمال می شود. سپس بازبینان می توانند به جای اینکه برچسب گذاری را از ابتدا انجام دهند، عملکرد هوش مصنوعی را بررسی کنند.

لاندو در یک پست وبلاگی در صفحه متوسط ​​خود به خوبی آن را تجزیه می کند: تصور کنید الگوریتمی را انجام می دهید که برای شناسایی بتمن در فیلم های بتمن طراحی شده است. میکرومدل شما بر روی پنج تصویر که بتمن کریستین بیل را به تصویر می کشد آموزش داده می شود. می توان دیگری را برای شناخت بتمن بن افلک و … آموزش داد. با هم، الگوریتم بزرگ‌تری را با استفاده از هر بخش کوچک می‌سازید، سپس آن را در مجموعه به‌عنوان یک کل آزاد می‌کنید.

او گفت: “این چیزی است که ما دریافتیم که بسیار خوب کار می کند، زیرا شما می توانید با شفاف سازی بسیار بسیار کمی و شروع فرآیند کنار بیایید.”

Encord داده های منتشر شده را در حمایت از ادعاهای لاندو منتشر کرد. به عنوان مثال، مطالعه ای که با همکاری کالج کینگز لندن انجام شد، CordVision را با یک برنامه برچسب گذاری که توسط اینتل توسعه یافته بود مقایسه کرد. پنج برچسب به 25744 فریم ویدئویی آندوسکوپی پرداختند. متخصصان گوارش از CordVision 6.4 برابر سریعتر بودند.

این روش همچنین زمانی مؤثر است که روی مجموعه آزمایشی 15521 اشعه ایکس COVID-19 اعمال شود. مردم تنها 5 درصد از کل تصاویر را مشاهده کردند و دقت نهایی مدل برچسب‌گذاری هوش مصنوعی 93.7 درصد بود.

با این حال، Enord تنها شرکتی نیست که این مشکل را شناسایی کرده است و به دنبال استفاده از هوش مصنوعی برای هموارسازی فرآیند برچسب‌گذاری است. شرکت های موجود در این زمینه در حال حاضر رتبه های بالایی را گزارش کرده اند. به عنوان مثال، Scale AI در سال 2021 به تخمین 7.3 میلیارد دلار رسید و Snorkel به وضعیت تک شاخ رسید.

Scale AI وارد بازی داده های مصنوعی می شود

به گفته Landau، بزرگترین رقیب این شرکت احتمالا Labelbox است. هنگامی که TechCrunch در مرحله سری A آنها را پوشش داد، Labelbox به حدود 50 مشتری افتخار کرد. در ژانویه، این شرکت سری D 110 میلیون دلاری را بست و آن را در فاصله 1 میلیارد دلاری قرار داد.

CordVision هنوز هم یک ماهی بسیار کوچک است. اما در داده هایی که یک موج جزر و مدی را نشان می دهد، گیر افتاده است. لاندو می گوید که این شرکت به دنبال مکان هایی است که هنوز از ابزارهای منبع باز یا داخلی استفاده می کنند تا برچسب گذاری داده های خود را انجام دهند.

تا کنون، این شرکت پس از فارغ التحصیلی از Y Combinator، 17.1 دلار سرمایه اولیه و سری A جمع آوری کرده است. این شرکت از دو بنیانگذار خود به یک تیم 20 نفره تبدیل شده است. لاندو می گوید که Encord پول نقد نمی سوزاند. این شرکت در حال حاضر به دنبال جذب سرمایه نیست و معتقد است که جذب سرمایه فعلی برای عبور این ابزار از فرآیند تجاری سازی کافی خواهد بود.