הטיפים המובאים להלן ניתנו על ידי מאט כץ, המהנדס הראשי של גוגל, בנושא סיומות קבצים באתר.
כל הסיומות : .php .asp, .html .htm קבילות על ידי גוגל ואין העדפה רשמית לאף אחת מהן.
קבצי .exe לעומת זאת הינם קבצים בינאריים בדרך כלל, אשר כוללים ברוב הפעמים מידע לא מתאים לאנדקוס, וישנן סיומות נוספות אשר כדאי להימנע מהם. אם לקבצים שלכם יש את הסיומות הבאות: .dll או .bin ואתם רואים כי הזחלנים של גוגל אינם מאנדקסים אותם, מומלץ כי תשנו את הסיומות למשהו אחר.
ישנה דרך פשוטה לברר אם קובץ בעל סיומת מסוימת יזכה ליחס חיובי מצד הזחלנים של גוגל. אם תבצעו שאילתא לדוגמא: filetype:exe ולא תמצאו אף url המסתיים ישירות בסיומת .exe תוכלו להסיק מכך שתי מסקנות:
אין קבצים כאלה ברשת – ואנו יודעים כי אין זה נכון,
שגוגל בוחר לא לאנדקס כעת דפים אלה מפני שבעבר הזחלנים לא מצאו בדפים אלה מידע ערכי עבור הגולשים.
אם תבצעו את השאילתות הבאות: filetype:tgz או filetype:tar – תקבלו מידע כמו זה: “papers.ssrn.com/pape.tar?abstract_id”, אשר אכן כולל בתוכו“.tar”אך לא עולים קבצים עם סיומת זאת. עובדה זאת, ככל הנראה, תעיד על כך כי כדאי לכם לשנות את סיומת הקובץ שלכם למשהו אחר.
החבר’ה מ – SEOmoz נתקלו בבעיה הבאה: כל עוד היתה להם סיומת “/web2.0/”, לא היתה כל בעיה לאנדקס את הדף. אך כאשר הם הורידו את הסלאש ושינו את הסיומת ל – “/web2.0″, הזחלנים לא אינדקסו את הדפים האלה מפני שגוגל לא נהג לאנדקס דפים המסתיימים ב – “.0″
על אף העובדה כי urlים המסתיימים ב “0” הינם, לעיתים קרובות, בינאריים ועל כן נזרקים מאוחר יותר בשלב עיבוד הנתונים, בימים אלה ממש, גוגל מוכנה לאנדקס גם דפים המסתיימים ב – “0”. דוגמא ל – url כזה שאונדקס רק לאחרונה: www.apqc.org/hm_web2.0