בקשה לפטנט שהוגשה על ידי גוגל (NSDQ:GOOG) לארגון World Intellectual Property ביוני 2007 ושפורסמה ביום חמישי, מעידה על טכניקות חיפוש מתוחכמות יותר.
הבקשה מעידה על כך שהסוגיות בנושא פרטיות שהועלו בעקבות הופעת Google Maps street view ילכו וייעשו מסובכים יותר, שגולשי YouTube יוכלו אולי יום אחד לבצע חיפושים על פי מילות מפתח של טקסטים המופיעים בתוך סרטי הוידאו, ושיום אחד אולי ניתן יהיה לבצע חיפוש בגוגל אשר יניב רשימה של מוצרים הנמצאים על מדפי חנות מקומית.
“recognizing text in images” הינה בקשה לפטנט של שיטה לזיהוי תווים אופטיים בתמונות דיגיטאליות.
“תמונות דיגיטאליות יכולות להכיל מגוון רחב של תכנים”, מוסבר בבקשת הפטנט. “לדוגמא: תמונות דיגיטאליות יכולות להציג נופים, אנשים, קטעים עירוניים ועוד. תמונות דיגיטאליות לעיתים קרובות מכילות טקסט. ניתן לצלם תמונות דיגיטליות באמצעים שונים, לדוגמא, מצלמות או במקלטי וידאו דיגיטאליים. טקסט תמונתי (טקסט בתוך תמונה) כולל בד”כ טקסט בגדלים שונים, כיווני הדפסה וצורות גופן שונות. טקסט בתמונה דיגיטאלית הנוצר, לדוגמא, מסצנה עירונית (לדוגמא, סצנה ברחוב) מספק לעיתים קרובות מידע אודות המתרחש בקטע זה או פרטים אודות המקום. סצנה עירונית טיפוסית מכילה, לדוגמא, טקסט כחלק משלטי רחוב, שמות בניינים, כתובות ושלטי חלונות”.
בסיס הנתונים של התמונות שתומך ב- Google Maps Street View מכיל הרבה סצנות רחוב עם טקסט מסוג שכזה. היכולת לבצע שאילתה של שמות חנויות הנמצאות בתמונות של תצוגת רחוב, יכולה להיות דרך יעילה לביצוע חיפושים מקומיים.
דובר גוגל אמר במייל: “אנו מגישים בקשות לפטנטים עבור מגוון רחב של רעיונות שהועלו על ידי העובדים שלנו. חלק מרעיונות אלה הופך בשלב מאוחר יותר למוצר אמיתי או לשירות, וחלק לא. מוצרים עתידיים לא בהכרח מבוססים על בקשות פטנט אלה”.
בכל אופן כדאי להזכיר את הרקע של Luc Vincent ושל Adrian Ulges, שני מדעני המחשב מאחורי בקשות הפטנט. וינסנט מציג עצמו באתר שלו כ”מוביל מספר פרויקטים גדולים הקשורים בתחום הארץ (geo), כוללstreet view“, כמי ש”אחראי על מספר היבטים הנדסיים של Google Book Search ” וכ”ראש המחלקה של יוזמות הקשורות
ב- Google OCR (זיהוי תווים אופטיים)”.
אולגס מציין באתר שלו את מעורבותו בפיתוח “מערכת שלומדת באופן עצמאי לתייג תמונות וידאו ברמה גבוהה של עקרונות סמנטיים, על ידי צפייה בסרטי וידאו מפורטלים מקוונים כמו http://youtube.com“
הבקשה לפטנט חוזה “יתרונות אפשריים נוספים כתוצאה מהטכנולוגיה” ומציינת כי “ניתן לשפר את דיוק הזיהוי של קטעים נבחרים של טקסט הנמצא בתוך התמונות”. “הטקסט שבתמונות יכול גם לשמש לשיפור חיפושי תמונות. ניתן לאחסן ולשייך את הטקסט לתמונה ספציפית, דבר שישפר את תוצאות החיפוש, בעת חיפוש אחר תמונה ספציפית. בנוסף, ניתן לשלב את הטקסט עם מידע מקומי מאונדקס, לשיפור תוצאות חיפוש המבוססות על מיקום. הטקסט יכול לספק מילות מפתח לזיהוי מקום ספציפי ולהציג למשתמש תמונות מהיעד הנבחר”.
גוגל כמובן שוקלת להשתמש בטכנולוגיה כדי להעלות את ערך הפרסום באמצעות חיפוש. “לדוגמא: גולש מבצע חיפוש למקדונלד’ס בעיר מסוימת או בסמוך לכתובת כלשהי”, מוסבר בבקשת הפטנט. “אפליקציית המיפוי מחוללת מפה למקדונלד’ס וגם מציגה תמונה של מקדונלד’ס. באמצעות הטקסט המאונדקס שבתוך התמונה של מקדונלד’ס, ששימש לזיהויה, וחיבור לנתוני מיקום המשויכים לאותה תמונה, ניתן לזהות את המקדונלד’ס הספציפי בתמונה”.
אך גוגל גם חוזה שימושים חדשים. כשם שיצרה גוגל את שירות Street view באמצעות רכבים שצוידו במצלמות שנסעו בדרכים עירוניות ולכדו סדרת תמונות של הנסיעה, ענק החיפוש מדמיין שיוט בין מדפי הסופר באמצעות רובוטים נושאי מצלמות בכדי ליצור מה שאולי יקרא Google Product View (תצוגת מוצרים). “בישום אחד, חנות (לדוגמא, חנות מכולת או חנות לחומרי בניין) הינה מאונדקסת”, מוסבר בבקשת הפטנט. “תמונות של מוצרים בחנות מצולמות, לדוגמא, באמצעות שימוש ברכב ממונע קטן או ברובוט. חוצים את מעברי החנות ומצלמים תמונות של מוצרים באופן דומה לשיטת ה-Street view. בנוסף, כאמור, מידע על מיקום משויך לכל תמונה. הטקסט נשלף מתמונות המוצרים. טקסט שנשלף יכול להיות מסונן על ידי שימוש בבסיס נתונים של שמות המוצרים, כדי למקד תוצאות בזיהוי תווים על שמות מוצרים”.
אפשרויות שכאלה הינן כמובן בגדר ספקולציות בלבד, ואולי, בדומה ל Google Perp Locator או Google Babe/Stud Finder (“צייד חתיכים וחתיכות”), שאינם קיימים אך ככל הנראה משתוקקים להם, לעולם לא יתרחשו.
המאמר תורגם מתוך ה- informationweek.