פרופ’ עודד שמואלי, המשנה לנשיא למחקר, נואם בכנס
“כדי לשפר את איכות הצילום הדיגיטלי במצלמות קטנות יהיה צורך לצלם כמה תמונות ולהתיך אותן לתמונה אחת טובה – משקפי גוגל הם הראשונים לפעול כך”.
“חדי עין, וגם כאלה שלא, יכולים להבדיל בין תמונה שצולמה במצלמה איכותית לבין תמונה שצולמה במצלמה של טלפונים סלולאריים, אבל זה לא ישאר כך הרבה זמן”. כך אמר פרופ’ פיימן מילנפאר מאוניברסיטת קליפורניה בסנטה קרוז, מומחה בעיבוד תמונה וראיה מלאכותית שעבד לאחרונה כשנה בחברת גוגל. הוא דיבר בוועידה הבינלאומית השנתית הרביעית של המרכז להנדסת מחשבים (TCE) ע”ש הנרי טאוב שהתקיימה בטכניון. הצוות בו עבד פרופ’ מילנפאר מפתח את התוכנה למשקפי גוגל (Google Glass).
פרופ’ עודד שמואלי, המשנה לנשיא הטכניון למחקר שפתח את הכנס, אמר: “אנחנו נמצאים בעיצומו של תהליך שיוביל לעידן חדש. תחומי המחקר הנדונים בכנס, כמו בינה מלאכותית, ראייה ממוחשבת ועיבוד תמונה, ישפיעו על כל תחומי חיינו. בתוך עשור מהיום ייסעו בכבישים מכוניות המצוידות במחשב, חיישנים, מערכת ניווט ורדאר, ומערכות אלה יאפשרו להן לנסוע לבד ללא התערבותו של הנהג.”
“המרכז להנדסת מחשבים בטכניון נחנך לפני שלוש שנים, ומאז הפך למרכז מצוינות המוביל מחקרים פורצי דרך,” אמר ראש המרכז פרופ’ אסף שוסטר, “הצלחנו ליצור כאן מודל חדש לשיתוף פעולה בין האקדמיה והתעשייה.”
לדברי פרופ’ מילנפאר במצלמות הפשוטות שמותקנות היום בטלפונים סלולאריים ובטאבלטים, ובעתיד הקרוב ישמשו בהתקני מיחשוב לביש – קשה ואולי בלתי אפשרי להגיע לרמה של מצלמות ייעודיות. הן חסרות את כל החלקים הנעים ואת העדשות המורכבות והכבדות שיש במצלמות מקצועיות. גם הצורך לא להכביד על המשתמשים, שגורם למתכננים להפוך אותן לקלות וקטנות, לא מאפשר להן להתחרות במצלמות הטובות מבלי להתקל במגבלות פיזיקליות. המיזעור ההולך וקטן של המכשירים מקשה מאוד על הכנסת אור למכשיר ומה שנשאר הוא להשתמש באלגוריתמים מתוחכמים כדי לפצות על ההקטנה.
“תפקידי בגוגל היה לפתח את תחום הצילום הממוחשב הממזג לתוכו מספר תחומים ותיקים כגון עיבוד תמונה, צילום, גרפיקה ממוחשבת וראיה ממוחשבת. הוא כולל פיתוח אלגוריתמים, חומרה אופטיקה וטכניקות עיבוד תמונה (Rendering)”, הדגיש פרופ’ מילנפאר.
“העקרון די פשוט – במקום תמונה אחת מצלמים רצף של תמונות, ואחר כך מתיכים אותן לתמונה אחת. זו יכולה להיות תמונה ברזולוציה גבוהה מאוד, תכונה טריוויאלית שמתאפשרת מעצם השימוש בצילומים מרובים, אבל אפשר לחשוב גם על ‘טריקים’ אחרים, כמו למשל צילום כמה תמונות מזוויות שונות, וחישוב המרחק לעצמים, כך שניתן יהיה להחליט על איזור בתמונה שייראה ממוקד ושאר התמונה תהיה מעורפלת, כדי לקבל תחושת עומק. ‘טריק’ אחר יהיה ללכוד דברים שלא ניתן לראות בעין, כמו למשל ראיית לילה (באמצעות חיישנים אינפרה-אדומים), היכולת להבחין בשינויים המתרחשים מהר מאוד או לאט מאוד, הבחנה בפרטים עדינים (למשל תנועת נשימה של תינוק במצלמות המותקנות בחדרי ילדים)”.
המדענים (ותלמידי התיכון) המשתמשים במיקרוסקופ בוודאי מכירים את התופעה שכאשר הם מתבוננים בדגימה, הם רואים רק את החלק שבמרכז התמונה באופן חד ושאר החלקים מעורפלים. התכה של התמונות תאפשר להפיק צילום אחד שבו כל חלקי הדגימה חדים וברורים. Google Glass” הוא המכשיר הראשון המכיל מצלמה שבכל לחיצה מצלמת מספר תמונות ומתיכה אותן”, הוסיף פרופ’ מילנפאר
פרופ’ אמנון שעשוע מהאוניברסיטה העברית, מנכ”ל חברת מובילאיי וממייסדי חברת הסטארט-אפ אורקם תיאר תפיסה אחרת למיחשוב לביש מבוסס מצלמה. החברה פיתחה מערכת הכוללת מצלמה ומיקרופון המתחברת למשקפיים רגילים. המערכת מאפשרת לכבדי ראיה להצביע על חפצים כדוגמת שלטי רחובות, רמזורים, אוטובוסים או תפריטים במסעדה והמכשיר קורא להם את התפריט או מספר להם מה צבע הרמזור.
“התפיסה של OrCam שונה מזו של גוגל – לא צילום תמונה בכל פעם שהמשתמש מבקש אלא צילום וידאו רציף ועיבוד מיידי. הדבר דורש הערכות שונה לחלוטין מבחינת החומרה ובפרט בכל הקשור לצריכת האנרגיה”, אמר פרופסור שעשוע.
בתמונה בעמוד הבית: פרופ’ פיימן מילנפאר עם משקפי גוגל בכנס.
צילום: יוסי שרם, דוברות הטכניון