Дигиталната революция на средновековните еврейски ръкописи

  • Международен проект насърчава автоматичното транскрипиране на стотици хиляди средновековни еврейски ръкописи, като централният му фокус е Кайро Гениза.
  • Националната библиотека на Израел и платформата Ktiv ръководят дигитализацията и отвореното публикуване на текстовете, подкрепени от финансиране от Европейския изследователски съвет.
  • Инициативата MiDRASH съчетава изкуствения интелект и хуманитарните науки, за да реконструира средновековната еврейска литературна култура и да улесни нови академични изследвания.
  • Съвместните сесии за транскрипция и преглед позволяват подобряването на моделите с изкуствен интелект и отварят архива за изследователи и обществеността по целия свят.

средновековни еврейски ръкописи

Огромната колекция от средновековни еврейски ръкописи Кайрската гениза, както е известна, преживява ключов момент благодарение на изкуствения интелект. След десетилетия, през които само малка част от материалите е била лесно достъпна, комбинацията от масова дигитализация И системите за разпознаване на текст наистина започват да отварят този уникален архив за изследователите и широката общественост.

Това, което доскоро изглеждаше като мечта за филолозите и историците — способността да търсете, четете и сравнявайте Идеята стотици хиляди средновековни еврейски фрагменти да бъдат достъпни от всеки компютър се превърна в конкретен проект. Чрез платформата Ktiv на Националната библиотека на Израел и програмата MiDRASH са генерирани предварителни транскрипции на почти всички фрагменти от Гениза и в момента се провежда подготовка за тяхното преразглеждане, подобряване и публично публикуване.

Гигантски средновековен архив, най-накрая четлив

колекция от средновековни еврейски ръкописи

Поканата за представяне на предложения Кайро Гениза Счита се за най-голямата и най-разнообразна колекция от средновековни еврейски документи, запазени в света. В продължение на близо хиляда години еврейската общност на египетската столица е съхранявала там религиозни, правни, търговски и литературни текстове, които, поради традицията да не се унищожават писания в името на Бог, не са могли просто да бъдат изхвърлени. Резултатът е колекция, която днес се оценява на около [липсващ брой]. 400.000 фрагмента, запазен до голяма степен благодарение на сухия климат на Египет.

Въпреки важността си, колекцията е използвана само частично: доскоро по-малко от една трета от материалите са били каталогизирани и едва... 10-15% са имали препис четливи. Останалите, макар и дигитализирани и достъпни в графична форма, оставаха трудни за систематична работа, тъй като четенето на средновековни курсивни или полукурсивни еврейски ръкописи изисква много опит и време.

Новият етап от проекта променя този пейзаж. Надграждайки върху инфраструктурата на Ktiv – дигиталната база данни на всички известни еврейски ръкописи, управлявана от Националната библиотека на Израел – международен екип е разработил автоматични транскрипционни системи способни да преобразуват тези фрагменти в дигитален текст с възможност за търсене, поне в първа версия, която след това ще бъде усъвършенствана.

Според данни, публикувани от институцията, вече са генерирани предварителни преписи за почти всички елементи на Кайро Гениза, в допълнение към хиляди допълнителни еврейски ръкописи получени от други средновековни колекции. За област, която е работила част по част в продължение на повече от век, скокът в мащаба е трудно да се надцени.

MiDRASH: Изкуственият интелект и хуманитарните науки в услуга на еврейските ръкописи

В центъра на тази трансформация е MiDRASH (Миграции на текстови и писмени традиции чрез мащабен изчислителен анализ на средновековни ръкописи на еврейски език). интердисциплинарен проект който обединява специалисти от Израел и Европа. Инициативата стартира през 2023 г. благодарение на грант от 10 милиона евро по програмата ERC Synergy, отпуснат от Европейския изследователски съвет за период от шест години, първият по рода си, специално посветен на еврейските изследвания.

Целта на MiDRASH не се ограничава само до транскрибиране на стари текстове. Както обяснява един от директорите му, професор Даниел Щокл Бен Езра, амбицията е Реконструиране на средновековната еврейска литературна култура на книгата, проследявайки кои автори цитират други, как равинските коментари (мидрашим) разпространяват между мюсюлманските и християнските общности или как писмените традиции се трансформират през вековете.

За да направи това възможно, екипът е избрал да работи в рамките на платформа с отворен код. СкрипториумПроектирана за автоматична транскрипция на ръкописи и надписи, системата разработва специфични модели за средновековна еврейска писменост, обучени върху хиляди транскрипции, ръчно съставяни от специалисти в продължение на много години. Резултатът е система, която може да сегментира редове и думи в древни изображения и да ги преобразува в редактируем текст.

Отговорните лица подчертават, че въпреки че първоначалните транскрипции съдържат грешки – нещо неизбежно при неправилен почерк, счупени фрагменти или избледнели мастила – техните практическа полезност То е огромно: те ви позволяват бързо да намерите библейски пасажи, части от Талмуда, писма, договори или литургични текстове, нещо, което преди изискваше търпеливо четене страница по страница.

От микрофилми до отворени платформи: дълъг път

дигитализация на средновековни еврейски ръкописи

Настоящата дигитална революция на средновековни еврейски ръкописи Не се е появило от нищото. Самата Национална библиотека на Израел припомня, че още през 1950 г., по инициатива на премиера Давид Бен-Гурион, е създаден Институтът за микрофилмирани еврейски ръкописи. Тъй като не е било реалистично физически да се преместят всички колекции в Йерусалим, решението е било да се заснемат колкото се може повече колекции на микрофилм, полагайки основите на голям визуален архив.

През десетилетията някои бяха включени 1.500 колекции От различни източници, като от 2006 г. насам материалите от Кайро Гениза са интегрирани в т. нар. Проект „Фридберг Гениза“, който ускорява систематичното им дигитализиране. През 2014 г. Националната библиотека започва да конвертира своя фотографски архив в дигитална колекция, достъпна онлайн, което позволява за първи път на всеки потребител да търси и преглежда хиляди еврейски ръкописи онлайн.

MiDRASH надгражда директно върху предишната работа. Използвайки инфраструктурата на Ktiv, която вече е консолидирала повечето от известните еврейски ръкописи в единна база данни, екипът използва алгоритми на автоматично обучение да идентифицира букви, думи и текстови структури. Тази комбинация от централизиран архив и усъвършенствани изчислителни инструменти избягва един от основните проблеми, които съществуват в други области, като например изучаването на арабски ръкописи, където материалът е много по-разпръснат.

Д-р Цафра Сиу, ръководител на изследователски проекти в Националната библиотека, определя MiDRASH като истински точка на огъване за всеки, който работи със средновековни еврейски ръкописи. Според него, скокът напред не е само в улесняването на достъпа, но и в това да се даде възможност за видове анализ, които поради огромния мащаб са били невъзможни, когато всеки документ е трябвало да се чете на ръка и почти самостоятелно.

Международни сътрудничества и семинари за транскрипция

Проектът MiDRASH функционира като международен консорциум, съчетаващ техническа и хуманитарна експертиза. Сред главните изследователи са професор Нахум Дершовиц (Университет в Тел Авив), д-р Ави Шмидман (Университет Бар-Илан) и професор Джудит Олшови-Шлангер (Оксфордски университет), заедно с екипи от Университета в Хайфа, Националната библиотека на Израел и... Проектът „Принстън Гениза“, режисиран от професор Марина Рустоу.

Инициативата далеч не се ограничава само до лабораторна работа, а отваря и възможности за участие на обществеността. От 24 до 27 ноември в Йерусалим беше организирано мащабно събитие с онлайн стрийминг. „Транскрибиран маратон“ фокусирани върху средновековни и съвременни еврейски ръкописи с курсив и полукурсив. По време на тези сесии обучени доброволци преглеждат и коригират транскрипциите, генерирани от изкуствен интелект.

Този съвместен подход преследва двойна цел. От една страна, да подобри качество и прецизност От една страна, самите текстове се анализират; от друга, се използват човешки корекции за допълнително обучение на моделите за разпознаване, така че в бъдеще броят на грешките да се намали и дори най-проблемните ръце да бъдат разпознавани по-добре. Идеята е системата да се учи, малко по малко, от натрупания опит на филолози, палеографи и специалисти по иврит.

Националната библиотека на Израел посочи, че окончателните преписи на Кайро гениза ще бъдат включени в Ktiv и ще бъдат предоставени на обществеността заедно с оригинални изображения на всеки ръкопис. По този начин всеки изследовател може да сравни това, което машината вижда, с това, което се вижда във факсимилето, като по този начин се запазва прозрачността и се позволяват нови четения или бъдещи корекции.

Нови въпроси към стара история

След като фазата на масова транскрипция приключи, ръководителите на проекта се стремят да надхвърлят обикновения достъп. Планът е да могат да изпълняват лингвистичен и текстов анализ в голям мащаб: откриване на вериги от цитати, идентифициране на перифрази, реконструиране на маршрути на идеи или проследяване на еволюцията на определени богословски и правни мотиви през вековете.

На практика това означава, че средновековните еврейски ръкописи престават да бъдат просто изолирани части по рафтове или в дигитални архиви и започват да функционират като взаимосвързана мрежа от текстовеИзкуственият интелект помага да се открият модели, прилики и повторяемости, които биха се изгубили при чисто индивидуално четене, докато специалистите предоставят историческия и филологически контекст, за да интерпретират какво означават тези връзки.

Някои от специфичните интереси на екипа включват проследяване на траекторията на мидрашим, равинските разкази и коментари, разпространявани сред еврейските общности в мюсюлмански и християнски територии. Възможността да се картографира как версиите на един и същ текст варират в зависимост от региона или епохата, отваря вратата към по-добро разбиране на... културни контакти, вътрешните конфликти и доктриналните преосмисляния, възникнали през Средновековието.

Изследователите настояват, че машинната транскрипция, дори и с нейните несъвършенства, е само началото. По-нататъшни разработки ще бъдат възможни върху тази основа. сравнителни изследвания речник, синтаксис или стилове на писане, но също така социални и икономически анализи, основани на писма, търговски договори или правни документи, които досега едва ли са били систематично изследвани.

Глобално въздействие и възможности за Европа

Въпреки че проектът е с произход от Израел и се координира от него, неговите последици се разпростират изцяло върху европейската академична общност. Грантът от ERC Synergy, който финансира MiDRASH, е част от политиката на Европейския съюз за подкрепа на цифрови инфраструктури за хуманитарни науки, а няколко от основните изследователи работят в университети във Франция, Обединеното кралство и други страни.

За европейските специалисти по средиземноморска история, средновековен юдаизъм или класически ислям, наличието на такава всеобхватна и лесна за търсене база данни представлява значителна промяна. Досега реконструирането на живота на еврейските общности, живеещи в мюсюлмански територии – където мюсюлманите дори са живели – беше сложно начинание. 90% от средновековното еврейско население— Това изискваше пътуване и ограничен достъп до архиви. С постепенното отваряне на Ktiv голяма част от този материал става достъпен от всеки кампус или изследователски център.

Освен това, методологията, разработена в MiDRASH, предлага модел, който може да бъде разширен и до други европейски документални колекции: от колекции от латински ръкописи до нотариални или църковни архиви. Идеята за комбиниране на дигитализация, автоматична транскрипция и публично сътрудничество се очертава като възпроизводим маршрут да се запазят и проучат други обекти на културното наследство, които са изложени на риск от влошаване на състоянието им.

Ръководителите на проекта са уверени, че публикуването на резултатите в рецензирани научни списания ще затвърди този подход в рамките на академичните стандарти. Междувременно, отворен достъп Изображенията и транскрипциите обещават да улеснят съвместната работа между университети в Израел, Европа и Америка, генерирайки по-широки изследователски мрежи около средновековните еврейски ръкописи.

Развитието на изкуствения интелект, приложено към Кайро Гениза и други еврейски ръкописи, превръща един почти неуправляем архив в... жив и разрастващ се източникТова, което някога е изисквало години щателно четене, сега може да бъде проследено за секунди, без да се омаловажава значението на експертната работа, а по-скоро обратното: освобождава се време за задаване на по-сложни въпроси и за задълбочено тълкуване на наследство, което малко по малко престава да бъде скрито съкровище и се превръща в споделен ресурс в световен мащаб.

ръкописи-0
Свързана статия:
Нови открития и технологии в изучаването на исторически ръкописи