Sarit Perkol internet pages


אבן הרוזטה על דיסק

מאת שרית פרקול

מעריב, נובמבר 2002

50 עד 90 אחוזים מכל הלשונות בעולם צפויות להיעלם במאה הבאה - רבות מהן בלי להותיר כמעט תיעוד. רוב העבודה שנעשתה בתחום הזה, בעיקר על שפות עם מספר דוברים קטן, חבויה בתיקיות פרטיות של חוקרים, או שמורה במצב גרוע בארכיונים הסובלים ממצוקת מימון. במאמץ להציל את המורשת הקריטית הזאת של גיוון לשוני, החליטה קרן Long Now להשתמש באינטרנט על מנת לערוך סקר רחב-היקף של לשונות ולשמר באופן פיזי ונצחי ככל האפשר 1,000 מתוך כ-7,000 הלשונות הקיימות על פני כדור הארץ. פרויקט השימור מתבסס על קוד פתוח ומשתף מומחים ודוברים ילידים של שפות שונות בעולם. התוצאה נשמרת על גבי דיסק ניקל שקוטרו פחות משמונה ס"מ, בעל תוחלת חיים של 2,000 שנה לפחות, שבעתיד הלא רחוק יוכל כנראה להימצא כמעט בכל בית מודרני.
הפרויקט נקרא "רוזטה", על שם אבן הרוזטה ההיסטורית שגילו חייליו של נפוליאון בראשיד, מצרים, ב-1799. לוח השחם כלל תרגומים ליוונית, לכתב החרטומים המצרי (ששימש את כוהני הדת) ולכתב הדמוטי המצרי (הכתב ששימש למטרות יומיומיות), של טקסט משנת 100 לפני הספירה. תומאס יאנג, דה סאסי וג'.פ. שמפוליון נעזרו בטקסט היווני כדי לפענח את כתב החרטומים.
באתר הפרויקט, www.rosettaproject.org, נכתב כי מטרתו משולשת: ליצור פלטפורמה חסרת-תקדים למחקר בבלשנות השוואתית; לפתח ולהפיץ ברבים כלי בלשני שימושי, שעשוי לעזור בשחזור שפות אבודות, או כמעט אבודות, בעתיד; ולהציע חפץ אסתטי המעיד על הגיוון הרב של הלשונות האנושיות ועל האיום הממשי מאוד להמשך הישרדותו של הגיוון הזה.

שלושה פרקים מספר בראשית

באתר מוסבר, כי מאגר 1,000 הלשונות בנוי לפי עקרון הטקסטים המקבילים של אבן הרוזטה המקורית - שמירת עשרה רכיבים תיאוריים מכל אחת מהלשונות. עם רכיבים אלה נמנים תיאור מפורט של השפה (המקור, התפוצה, מספר הדוברים, משפחת השפות, טיפולוגיה, היסטוריה וכדומה), מפת התפוצה הגיאוגרפית של השפה ויחסיה עם לשונות אחרות באזור, אורתוגרפיה (מערכות הכתיבה של השפה ומדריך הגייה), פונולוגיה (תיאור יחידות הצליל הבסיסיות של השפה וכיצד הן משתלבות זו בזו), דקדוק, רשימות מילים (בין 100 ל-200 מונחים בסיסיים), מערכת המספרים, טקסט משותף (פרקים א' עד ג' בספר בראשית) וקבצי קול עם דגימות של השפה המדוברת, לצד תעתיק שלה ואולי גם תרגום.
שיטת השגת החומרים פועלת לפי המודל ששימש ליצירת מילון אוקספורד המקורי - תרומות פתוחות וביקורת של דוברי השפה הילידיים. היעד, כפי שנכתב באתר הפרויקט, הוא ליצור "לינוקס של בלשנות": שיתוף פעולה מקוון, הנשען על אלפי מומחים אקדמיים ודוברים ילידיים של השפות מכל העולם. בפרויקט משתתפות גם קבוצות ארכיון "רשמיות" ממוסדות כמו סטנפורד, ייל, ברקלי וספריית הקונגרס האמריקנית.
ארכיון הרוזטה, שיווצר כתוצאה מהפרויקט המשותף, יהיה זמין לציבור בשלוש דרכים שונות: ארכיון מקוון חופשי, שהולך וגדל, באתר האינטרנט; ספר בן כרך אחד; ודיסק בעל תוחלת חיים ארוכה מאוד. המטרה היא להפיץ ברחבי העולם כמויות גדולות של הדיסקים האלה, בתוך מכלים מוגנים, לאנשים פרטיים למוסדות. גירסה 1.0, שתהיה זמינה כבר השנה, אמורה להיות חפץ נאה למראה, שיהווה גם ארכיון של 1,000 לשונות ויעזור למשוך את תשומת הלב לטרגדיה של היכחדות הלשונות - וכן להאיץ את העבודה על תהליך השימור.
לצורך השימור נבחר מדיום אחסון אנלוגי בעל צפיפות גבוהה מאוד, כאלטרנטיבה למערכות אחסון דיגיטליות, המתיישנות במהירות. הטכנולוגיה הזאת, שפותחה על ידי מעבדות לוס אלמוס וחברת "נורסאם טכנולוג'יז", משתמשת בטקסט ממוזער החקוק על דיסק הניקל, בדחיסה של עד 350,000 דפים לדיסק. הואיל והקידוד הוא תמונה אנלוגית (ולא ספרות 1 או 0 כבשיטה הבינארית) - אין כאן תלות בפלטפורמה או בפורמט. כך אפשר להיות בטוחים שניתן יהיה לקרוא את החומר גם במערכות עתידיות, עם אלגוריתמים שונים של דחיסה.

30,000 דפי טקסט על הדיסק

קריאת אבן הרוזטה המודרנית תצריך שימוש במיקרוסקופ אופטי או במיקרוסקופ אלקטרונים, בהתאם למידת הדחיסה. ניתן לשלב זאת עם מערכת OCR, שתקרא את הטקסט ותחזיר אותו לפורמט הדיגיטלי שיהיה רלוונטי במועד הקריאה העתידי. באתר מוסבר, שהכוונה היא שכדי שלא יהיה צורך במיקרוסקופ חזק מדי, הדחיסה תהיה לא יותר מ-30,000 דפי טקסט על הדיסק.
עיצוב הדיסק נעשה במשך שנה, בשיתוף פעולה בין אמנים, מעצבים, בלשנים ופעילים, בראשות מנהל הפרויקט, ג'ים מייסון. העיצוב כולל את מפת כדור הארץ במרכז, כמו גלגל, עם חישורים המצביעים כמו קרניים על 27,000 דפי נתונים על הלשונות - 27 דפים לכל אחת. במרכז מפת כדור הארץ נמצא המקור הגיאוגרפי של כל שפה, מסומן במספר התואם למיקום הנתונים של אותה שפה על החישורים. חגורה חיצונית של טקסטים מספר בראשית בשמונה לשונות מרכזיות (אנגלית, רוסית, הינדית, ספרדית, עברית, מנדרין, ערבית וסווהילי) מתחילה בגודל שניתן לקריאה בעין בלתי מזוינת ומצטמקת בהדרגה לממדים מיקרוסקופיים. זה אמור להקל על אנשים להבין מה מונח לפניהם ולהעביר את הרמז: השיגו לעצמכם אמצעי הגדלה, יש כאן עוד חומר קריאה.
הדיסק נתון בתוך מכל כדורי, שחציו העליון עשוי זכוכית אופטית המתפקדת גם כזכוכית מגדלת פי שישה, וחציו התחתון עשוי פלדת אלחלד איכותית. בתוכה יש גליל חלול, עם סרט מפלדת אלחלד, עליו אמורים המטפלים בדיסק לחקוק את שמותיהם, המיקום שלהם ותאריך - ליצירת שושלת יוחסין ייחודית שתלווה כל רוזטה במסעותיה בזמן ובמעבריה מאדם לאדם. מצורף גם כלי ניקוב קטן, שיאפשר לבעלי הדיסק העתידיים להוסיף מידע משלהם.
בסופו של דבר, הכוונה היא להנפיק דיסקים בהפצה המונית ברחבי העולם, במחיר כ-100 דולר ליחידה. עד אז, אנשים יוכלו לרכוש דיסק תמורת תרומה בסך 25,000 דולר. ואם אתם דוברי הלשונות איגו, איינו, אפריקנס, מייטי, אולד נורס, פאיוואן או טורויו - מארגני הפרויקט זקוקים לכם. לאתר יש אמנם נטייה קלה לקרוס מידי פעם, אבל מה זה לעומת הסיכוי להיכנס להיסטוריה.
אבן הרוזטה המקורית, אגב, שמורה מאז 1802 בבריטיש מיוזיאום, עם הפסקה אחת קצרה, לקראת סוף מלחמת העולם הראשונה, כאשר היה חשש מהפצצות כבדות על לונדון והאבן הועברה למשך שנתיים למקום מבטחים מתחת לאדמה.125