
قبل از اینکه بتوانید به ساخت الگوریتمی برای خواندن اشعه ایکس یا تفسیر یک اسمیر خون فکر کنید، دستگاه باید بداند در تصویر چه چیزی وجود دارد. کل وعده هوش مصنوعی در مراقبت های بهداشتی، حوزه ای که 11.3 میلیارد دلار سرمایه گذاری خصوصی را در سال 2021 جذب کرد، بدون مجموعه داده های برچسب گذاری شده دقیق که به ماشین ها می گوید دقیقاً به دنبال چه چیزی هستند، قابل تحقق نیست.
ایجاد این مجموعه دادههای برچسبگذاریشده در حال تبدیل شدن به خود صنعتی است که میتواند به شرکتهایی که در شمال وضعیت تکشاخ هستند، ببالند. امروز، Encord، یک استارت آپ کوچک که به تازگی از Y Combinator ظهور کرده است، به دنبال شرکت در این اقدام است. به منظور تولید مجموعه داده های برچسب گذاری شده برای پروژه های بینایی کامپیوتری، Encord نسخه بتای خود را از یک برنامه برچسب گذاری به کمک هوش مصنوعی به نام CordVision منتشر کرده است. این راه اندازی به دنبال برنامه های آزمایشی در پزشکی استنفورد، مموریال اسلون کترینگ و کینگز کالج لندن است. همچنین توسط Kheiron Medical و Viz AI آزمایش شده است.
Encord مجموعهای از ابزارها را توسعه داده است که به رادیولوژیستها اجازه میدهد تصاویر DICOM را بزرگنمایی کنند، قالبی که عموماً برای انتقال تصاویر پزشکی استفاده میشود. و به جای اینکه یک رادیولوژیست بنشیند و کل تصویر را حاشیه نویسی کند، نرم افزار طوری طراحی شده است که اطمینان حاصل شود که فقط قسمت های کلیدی تصویر برچسب گذاری می شوند.
Encord در سال 2020 توسط اریک لاندو با تجربه در فیزیک کاربردی و اولریک استیگ هانسن تاسیس شد. هانسن روی یک پروژه پایان نامه کارشناسی ارشد در کالج امپریال لندن کار می کرد که بر روی تجسم مجموعه داده های بزرگ برای تصاویر پزشکی تمرکز داشت. این هانسن بود که برای اولین بار متوجه شد که چقدر طول می کشد تا مجموعه داده های برچسب گذاری شده را مدیریت کند.
این مجموعه دادههای برچسبگذاریشده مهم هستند زیرا «حقایق اولیه» را ارائه میکنند که الگوریتمها میتوانند از آن بیاموزند. راههایی برای ساخت هوش مصنوعی وجود دارد که به مجموعه دادههای برچسبگذاری شده نیاز ندارد، اما تا حد زیادی هوش مصنوعی (بهویژه در مراقبتهای بهداشتی) به آموزش کنترلشدهای متکی است که به آنها نیاز دارد.
برای ایجاد یک مجموعه داده برچسبدار، بیش از یک پزشک به معنای واقعی کلمه تصاویر را یکی یکی مرور میکنند و چند ضلعیها را در اطراف ویژگیهای مربوطه ترسیم میکنند. در موارد دیگر می توان آن را با ابزارها یا حسگرهای منبع باز انجام داد. اما به هر حال، ادبیات علمی نشان می دهد که این گام یک مانع بزرگ در دنیای هوش مصنوعی در مراقبت های بهداشتی است، به ویژه در رادیولوژی، که یکی از زمینه هایی است که پیش بینی می شود هوش مصنوعی در آن پیشرفت های بزرگی داشته باشد، اما تا حد زیادی موفق به انجام آن نشد. تغییرات پارادایم اصلی .
«می دانم که شک و تردید زیادی وجود دارد [of AI in the medical world]. لاندو به TechCrunch گفت: “ما فکر می کنیم پیشرفت واقعا کند است.” ما معتقدیم که حرکت به سمت رویکردی که در وهله اول واقعاً به دادههای آموزشی فکر میکنید، به سرعت بخشیدن به توسعه این مدلها کمک میکند.»
به گفته نویسندگان یک مقاله در سال 2021 در Frontiers in Radiology، برچسبها به 24 سال کار نیاز دارند تا مجموعه دادهای از حدود 100000 تصویر را برچسبگذاری کنند. بیانیه موضع دیگری در سال 2021 که توسط انجمن اروپایی پزشکی هسته ای (EANM) و انجمن اروپایی تصویربرداری قلبی عروقی (EACVI) منتشر شد، خاطرنشان می کند که “به دست آوردن داده های برچسب گذاری شده در تجزیه و تحلیل تصویربرداری پزشکی می تواند زمان و تلاش لازم را داشته باشد. گران است.” اما او همچنین خاطرنشان می کند که تکنیک های جدیدی در حال ظهور هستند که می توانند کارها را سرعت بخشند.

اعتبار تصویر: پلت فرم برچسب زدن DICOM را ضبط کنید
از قضا، این تکنیک های جدید به خودی خود نسخه هایی از هوش مصنوعی هستند. به عنوان مثال، سند مرزها در رادیولوژی از سال 2021، نشان داد که با استفاده از یک رویکرد یادگیری فعال، فرآیند می تواند 87٪ سریعتر باشد. برای بازگشت به نمونه 100000 تصویر، تنها 3.2 سال کاری طول می کشد، در مقابل 24 سال.
CordVision اساساً نسخه ای از یک فرآیند یادگیری فعال به نام مدل سازی میکرو است. به طور کلی، این تکنیک توسط تیمی کار می کند که نمونه کوچک و معرف تصاویر را علامت گذاری می کند. سپس هوش مصنوعی خاص بر روی این تصاویر آموزش داده می شود و سپس در استخر وسیع تری که هوش مصنوعی برچسب گذاری می کند اعمال می شود. سپس بازبینان می توانند به جای اینکه برچسب گذاری را از ابتدا انجام دهند، عملکرد هوش مصنوعی را بررسی کنند.
لاندو در یک پست وبلاگی در صفحه متوسط خود به خوبی آن را تجزیه می کند: تصور کنید الگوریتمی را انجام می دهید که برای شناسایی بتمن در فیلم های بتمن طراحی شده است. میکرومدل شما بر روی پنج تصویر که بتمن کریستین بیل را به تصویر می کشد آموزش داده می شود. می توان دیگری را برای شناخت بتمن بن افلک و … آموزش داد. با هم، الگوریتم بزرگتری را با استفاده از هر بخش کوچک میسازید، سپس آن را در مجموعه بهعنوان یک کل آزاد میکنید.
او گفت: “این چیزی است که ما دریافتیم که بسیار خوب کار می کند، زیرا شما می توانید با شفاف سازی بسیار بسیار کمی و شروع فرآیند کنار بیایید.”
Encord داده های منتشر شده را در حمایت از ادعاهای لاندو منتشر کرد. به عنوان مثال، مطالعه ای که با همکاری کالج کینگز لندن انجام شد، CordVision را با یک برنامه برچسب گذاری که توسط اینتل توسعه یافته بود مقایسه کرد. پنج برچسب به 25744 فریم ویدئویی آندوسکوپی پرداختند. متخصصان گوارش از CordVision 6.4 برابر سریعتر بودند.
این روش همچنین زمانی مؤثر است که روی مجموعه آزمایشی 15521 اشعه ایکس COVID-19 اعمال شود. مردم تنها 5 درصد از کل تصاویر را مشاهده کردند و دقت نهایی مدل برچسبگذاری هوش مصنوعی 93.7 درصد بود.
با این حال، Enord تنها شرکتی نیست که این مشکل را شناسایی کرده است و به دنبال استفاده از هوش مصنوعی برای هموارسازی فرآیند برچسبگذاری است. شرکت های موجود در این زمینه در حال حاضر رتبه های بالایی را گزارش کرده اند. به عنوان مثال، Scale AI در سال 2021 به تخمین 7.3 میلیارد دلار رسید و Snorkel به وضعیت تک شاخ رسید.
به گفته Landau، بزرگترین رقیب این شرکت احتمالا Labelbox است. هنگامی که TechCrunch در مرحله سری A آنها را پوشش داد، Labelbox به حدود 50 مشتری افتخار کرد. در ژانویه، این شرکت سری D 110 میلیون دلاری را بست و آن را در فاصله 1 میلیارد دلاری قرار داد.
CordVision هنوز هم یک ماهی بسیار کوچک است. اما در داده هایی که یک موج جزر و مدی را نشان می دهد، گیر افتاده است. لاندو می گوید که این شرکت به دنبال مکان هایی است که هنوز از ابزارهای منبع باز یا داخلی استفاده می کنند تا برچسب گذاری داده های خود را انجام دهند.
تا کنون، این شرکت پس از فارغ التحصیلی از Y Combinator، 17.1 دلار سرمایه اولیه و سری A جمع آوری کرده است. این شرکت از دو بنیانگذار خود به یک تیم 20 نفره تبدیل شده است. لاندو می گوید که Encord پول نقد نمی سوزاند. این شرکت در حال حاضر به دنبال جذب سرمایه نیست و معتقد است که جذب سرمایه فعلی برای عبور این ابزار از فرآیند تجاری سازی کافی خواهد بود.