
گویی دانشمند بودن در زبان یونانی باستان اساساً به اندازه کافی دشوار نیست، متون اصلی که آنها به آنها تکیه می کنند اغلب آسیب دیده اند و نمی توان آنها را اصلاح کرد زیرا هزاران سال قدمت دارند. مورخان ممکن است یک ابزار جدید قدرتمند در Ithaca داشته باشند، یک مدل یادگیری ماشینی که توسط DeepMind ایجاد شده است که فرضیات دقیق شگفتآوری در مورد کلمات از دست رفته و مکان و تاریخ متن ایجاد میکند. این یک کاربرد غیرمعمول هوش مصنوعی است، اما نشان می دهد که چقدر می تواند در خارج از دنیای فناوری مفید باشد.
مشکل متون باستانی ناقص رشته های بسیاری را در بر می گیرد که در آنها متخصصان با مواد تخریب شده کار می کنند. سند اصلی می تواند از سنگ، گل یا پاپیروس ساخته شده باشد که به زبان اکدی، یونانی باستان یا خطی A نوشته شده است و همه چیز را از حساب یک بقال تا سفر یک قهرمان توصیف می کند. اما وجه مشترک همه آنها آسیبی است که در طول هزاران سال انباشته شده است.
شکاف هایی که متن فرسوده یا پاره می شود اغلب شکاف نامیده می شود و می تواند به کوتاهی یک حرف گم شده یا به اندازه یک فصل یا حتی یک داستان کامل باشد. تکمیل آنها ممکن است بی اهمیت یا غیرممکن باشد، اما شما باید از جایی شروع کنید – و اینجاست که ایتاکا به کمک نیاز دارد.
ایتاکا (که در جزیره اصلی اودیسه نامگذاری شده است) که در یک کتابخانه وسیع از متون یونان باستان آموزش دیده است، نه تنها می تواند بگوید کلمه یا عبارت گم شده چیست، بلکه می تواند از قدمت آن و محل نوشته شدنش عکس بگیرد. این یک چرخه کامل حماسی را به تنهایی پر نخواهد کرد – باید ابزاری برای کسانی باشد که با این متون کار می کنند، نه یک راه حل.
مقاله ای که در ژورنال نیچر منتشر شده است، با استفاده از برخی از احکام پریکلس آتن به عنوان مثال، کارایی آن را نشان می دهد. اعتقاد بر این است که در حدود 445 قبل از میلاد نوشته شده است، ایتاکا از تحلیل متنی خود نشان می دهد که در واقع مربوط به سال 420 قبل از میلاد یا بیشتر بر اساس شواهد جدیدتر است. شاید زیاد به نظر نرسد، اما تصور کنید که منشور حقوق بشر واقعاً 20 سال بعد نوشته شده باشد!

اعتبار تصویر: DeepMind
در مورد خود متن، کارشناسان در مطالعه دقیقاً در اولین گذر حدود 25٪ آن را دریافت کردند. این دقیقاً ستاره ای نیست، اگرچه، البته، بازیابی متن به معنای یک بعد از ظهر نیست، بلکه یک پروژه طولانی مدت است. با این حال، در ترکیب با ایتاکا، آنها به سرعت به دقت 72 درصد دست یافتند. این اغلب در موقعیتهای دیگری وجود دارد که افراد در نهایت دقیقتر هستند اما میتوانند با حذف سریع بنبستها یا ارائه یک نقطه شروع، روند خود را تسریع بخشند. در دادههای پزشکی، مشاهده یک ناهنجاری که هوش مصنوعی میتواند به سرعت آن را نشان دهد آسان است – اما در نهایت، این تجربه انسانی است که جزئیات را درک میکند و پاسخ درست را پیدا میکند.
اگر متن یونانی باستان پر از شکاف است، می توانید نسخه خلاصه شده ایتاکا را در اینجا امتحان کنید، یا از یکی از مثال های ارائه شده برای مشاهده نحوه پرکردن شکاف ها استفاده کنید. برای قطعات طولانیتر یا گم شدن بیش از 10 حرف، آن را در این دفترچه یادداشت Colab امتحان کنید. کد در این صفحه GitHub موجود است.
اگرچه یونان باستان منطقه ای آشکار و پربار است که می تواند در آن ایتاکا آغاز شود، تیم در حال حاضر سخت روی زبان های دیگر کار می کند. آکدی، دموتیک، عبری و مایا همگی در این لیست هستند و امیدواریم به مرور زمان موارد بیشتری را اضافه کنیم.
ایون اندروتسوپولوس، استاد دانشگاه آتن که بر روی این پروژه کار می کند، گفت: «ایتاکا سهم بالقوه پردازش زبان طبیعی و یادگیری ماشینی را در علوم انسانی نشان می دهد. ما به پروژههای بیشتری مانند ایتاکا برای نشان دادن بیشتر این پتانسیل نیاز داریم، اما همچنین به دورهها و مواد آموزشی مناسب برای آموزش محققان آینده نیاز داریم که درک مشترک بهتری از علوم انسانی و هنر داشته باشند.»